登录社区云,与社区用户共同成长
邀请您加入社区
《RAGFlow使用指南:文档解析与API调用实践》 文章摘要: RAGFlow是针对复杂文档(扫描件/含表格PDF)优化的知识库工具,在检索精度和文档解析能力上显著优于同类产品。本文提供:1)主流工具对比,突显RAGFlow在复杂文档处理优势;2)实战API指南,包含知识库创建、文件上传(支持智能去重)、文档解析状态监控及知识检索等核心功能;3)关键经验:检索接口优于对话接口、需设置相似度阈值过
模型是“数据炼成的规律工厂”。大语言模型借千亿参数、自监督“完形填空”习得通用语言,聊天写代码样样通。嵌入模型把文字转语义向量,支撑搜索推荐RAG。API、本地、SDK三法接入,敏感数据选本地,快速原型用API。
向量检索是目前 RAG匹配文档最重要的实现方式之一,其有效性和性能关系到RAG的可用性。这是常识通过sklearn余弦相似度,示例使用向量相似度的方法匹配文档的过程。除ollama进行向量计算外,示例过程仅使用numpy、sklearn,最基础展示文档相似匹配过程。
做向量的RAG肯定找不到工作,不为什么,就是过时了,Agent?那是人工智能编程的事。不是套模板……如果你能把RAG+Agent结合,那肯定能找到工作!如何不用向量数据库也能做RAG?而是要用Agentic方法搞定了百万token文档检索……这大把公司要的,因为你都能自己出来单干了!!!!就说我之前调试一个法律文档检索系统。客户的合同有800多页,切记800多页!传统RAG的向量检索总是找不到关键
2025年被誉为“Agent元年”,AI智能体正以惊人的速度从概念走向产业化落地。根据IDC最新市场概览,2025年第三季度,AI Agent领域迎来了显著的技术跃迁,其核心突破集中体现在多模态大模型驱动的跨平台协同能力上。对于广大程序员和技术从业者来说,这不仅是技术的革新,更是职业发展的重大机遇。
本文介绍了如何为LangChain的RAG Agent添加记忆功能,实现短期记忆以记住用户交互历史。文章详细讲解了通过消息列表实现记忆的方法,并针对对话历史过长导致上下文窗口限制的问题,提出了三种解决方案:Trim Messages、Delete messages和Summarize messages。此外,还介绍了如何自定义AgentState来扩展记忆功能。教程提供了完整的源码,适合希望提升R
本文介绍了如何基于Dify平台、大模型(LLM)和智能体(Agent)构建私有化智能助手。详细阐述了Dify开源平台的安装部署过程,包括Windows系统下的Docker安装步骤。重点演示了如何搭建私有化知识库,以"译点架构圈手册"为例展示了数据上传和处理流程。文章还简要说明了智能体作为核心组件的功能,能够自主决策并实现任务自动化处理。通过这一方案,用户可获得一个功能强大、易于
文章剖析了RAG知识库构建中的十大典型误区,包括数据质量、检索策略、文本拆分、知识更新等方面。针对每个误区,提出了可落地的优化技巧,如严格数据筛选、场景化检索适配、精细化文本拆分、建立知识更新机制、平衡召回率与精确率、领域嵌入模型优化、强化知识约束逻辑等,帮助RAG系统从"能用"升级为"好用",实现精准知识连接。
文章系统解析了AI Agent与Agentic AI的概念区别、应用与挑战,指出AI Agent是具备目标感知、推理决策能力的单一智能体,而Agentic AI是多智能体协作的生态系统。文章详细介绍了两种技术的架构、工作流程和实际应用场景,分析了各自的技术瓶颈和解决方案,并强调Agentic AI作为GenAI未来发展的重要方向,代表AI从"单兵作战"向"群体智能"的转变,是构建可解释、可治理、可
本文对于langchain 智能体的护栏进行讲解。首先对于护栏的概念、作用、实现模式进行介绍,然后分别用示例讲解langchain自带护栏及如何实现自定义的护栏,最后说明如何通过护栏堆叠实现对于智能体的多级安全保护。