logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

把一个 RAG 项目做成可插拔的知识基础设施

这篇文章介绍了一个模块化RAG(检索增强生成)知识基础设施项目,其核心价值在于工程化实现而非功能演示。项目采用分层架构设计,重点解决了五个关键问题:分层混合检索(结合BM25、稠密向量、RRF融合和重排)、五阶段文档摄取流水线、多模态图像转文本统一处理、基于状态机的对话编排,以及混合会话存储机制。通过组件解耦设计,支持LLM、Embedding等模块的自由替换,并实现了可观测性和评估闭环。项目将R

#python#fastapi#人工智能
LangGraph 工业级记忆模块实现深度指南

本文介绍了在LangGraph中实现工业级AI记忆模块的解决方案,通过滚动摘要、状态裁剪和异构存储三位一体的架构设计,解决了长对话场景下的Token膨胀问题。核心方案包括智能状态定义、滚动压缩节点实现,以及通过Checkpointer实现断点续传。该方案平衡了模型性能和用户体验,支持50+轮深度对话,并提供了ID处理、摘要策略优化等实践建议,为开发者构建长效记忆AI Agent提供了可行路径。

#python#人工智能#fastapi
拥抱自动化:使用 csdnAutoBlogMcp 实现 CSDN 博客的高效发布

本文介绍了csdnAutoBlogMcp工具,它能实现CSDN博客的自动化发布。该工具支持MCP协议集成,可嵌入VS Code等编辑器,通过AI生成内容直接发布;具备全流程自动化、Markdown原生支持等特点。工作原理是通过模拟接口与CSDN交互,用户只需在编辑器中输入指令即可完成发布。项目提供快速部署方案,开发者可手动配置或通过AI代理完成。文章强调该工具能提升知识沉淀效率,是"AI

#自动化#人工智能#python
LangGraph 工业级记忆模块实现深度指南

本文介绍了在LangGraph中实现工业级AI记忆模块的解决方案,通过滚动摘要、状态裁剪和异构存储三位一体的架构设计,解决了长对话场景下的Token膨胀问题。核心方案包括智能状态定义、滚动压缩节点实现,以及通过Checkpointer实现断点续传。该方案平衡了模型性能和用户体验,支持50+轮深度对话,并提供了ID处理、摘要策略优化等实践建议,为开发者构建长效记忆AI Agent提供了可行路径。

#python#人工智能#fastapi
LangGraph 工业级记忆模块实现深度指南

本文介绍了在LangGraph中实现工业级AI记忆模块的解决方案,通过滚动摘要、状态裁剪和异构存储三位一体的架构设计,解决了长对话场景下的Token膨胀问题。核心方案包括智能状态定义、滚动压缩节点实现,以及通过Checkpointer实现断点续传。该方案平衡了模型性能和用户体验,支持50+轮深度对话,并提供了ID处理、摘要策略优化等实践建议,为开发者构建长效记忆AI Agent提供了可行路径。

#python#人工智能#fastapi
把一个 RAG 项目做成可插拔的知识基础设施

这篇文章介绍了一个模块化RAG(检索增强生成)知识基础设施项目,其核心价值在于工程化实现而非功能演示。项目采用分层架构设计,重点解决了五个关键问题:分层混合检索(结合BM25、稠密向量、RRF融合和重排)、五阶段文档摄取流水线、多模态图像转文本统一处理、基于状态机的对话编排,以及混合会话存储机制。通过组件解耦设计,支持LLM、Embedding等模块的自由替换,并实现了可观测性和评估闭环。项目将R

#python#fastapi#人工智能
把一个 RAG 项目做成可插拔的知识基础设施

这篇文章介绍了一个模块化RAG(检索增强生成)知识基础设施项目,其核心价值在于工程化实现而非功能演示。项目采用分层架构设计,重点解决了五个关键问题:分层混合检索(结合BM25、稠密向量、RRF融合和重排)、五阶段文档摄取流水线、多模态图像转文本统一处理、基于状态机的对话编排,以及混合会话存储机制。通过组件解耦设计,支持LLM、Embedding等模块的自由替换,并实现了可观测性和评估闭环。项目将R

#python#fastapi#人工智能
把一个 RAG 项目做成可插拔的知识基础设施

这篇文章介绍了一个模块化RAG(检索增强生成)知识基础设施项目,其核心价值在于工程化实现而非功能演示。项目采用分层架构设计,重点解决了五个关键问题:分层混合检索(结合BM25、稠密向量、RRF融合和重排)、五阶段文档摄取流水线、多模态图像转文本统一处理、基于状态机的对话编排,以及混合会话存储机制。通过组件解耦设计,支持LLM、Embedding等模块的自由替换,并实现了可观测性和评估闭环。项目将R

#python#fastapi#人工智能
把一个 RAG 项目做成可插拔的知识基础设施

这篇文章介绍了一个模块化RAG(检索增强生成)知识基础设施项目,其核心价值在于工程化实现而非功能演示。项目采用分层架构设计,重点解决了五个关键问题:分层混合检索(结合BM25、稠密向量、RRF融合和重排)、五阶段文档摄取流水线、多模态图像转文本统一处理、基于状态机的对话编排,以及混合会话存储机制。通过组件解耦设计,支持LLM、Embedding等模块的自由替换,并实现了可观测性和评估闭环。项目将R

#python#fastapi#人工智能
LangGraph下Deep Agents 的动态智能体架构

智能体的力量来自于约束,而非限制。通过将 LLM 放入一个充满“中间件”和“物理隔离”的受控沙盒中,我们终于可以放手让 AI 去处理那些真正复杂的、多步骤的现实工程问题,而不仅仅是玩文字游戏。

#python#人工智能
    共 14 条
  • 1
  • 2
  • 请选择