登录社区云,与社区用户共同成长
邀请您加入社区
本文全面总结了大模型检索增强生成(RAG)技术,涵盖架构分类、评估方法、增强方案和应用场景。重点分析了5种RAG增强方案,包括SELF-RAG事后纠正和自适应检索等方法。文章详细解析了RAG三大关键模块:query理解(意图识别、改写/扩写)、检索模型(文档处理、向量索引)和生成模型(prompt策略)。通过对比微调方式,指出RAG在知识更新成本和任务效果方面的优势,但也存在依赖知识库等局限性。最
DeepResearch通常指由人工智能驱动的深度研究助手,能够自主地在网络上进行多步骤的调研,并将搜索到的信息进行分析和综合,最终生成结构完整、内容详实的报告。OpenAI对Deep Research的描述是:“
综合分析表明,HiRAG的分层方法使其成为一个技术上平衡且实用的解决方案起点。未来的发展方向可能包括将不同系统的优势元素进行融合,例如将分层结构与超图技术相结合,从而在下一代系统中实现更强大的混合架构。HiRAG系统代表了基于图的检索增强生成技术的重要进展,通过引入分层架构根本性地改变了复杂数据集的处理和推理方式。该系统将知识组织为从详细实体到高级抽象概念的分层结构,实现了深度多尺度推理能力,能够
文档处理层:负责文档的加载、解析和预处理向量化层:使用Embedding模型将文本转换为向量表示向量数据库:存储和管理文档向量,支持高效的相似性搜索检索增强生成层:结合检索结果和生成模型提供精准回答API服务层:提供RESTful接口供前端调用本文详细介绍了如何使用Spring AI和RAG技术构建企业级智能文档问答系统。通过合理的架构设计、性能优化和实际应用场景的考虑,我们能够构建出高效、可靠的
智能体式RAG是一种由AI智能体驱动的RAG方法。它通过利用智能体来管理任务、从多个来源获取信息并处理更复杂的工作流,从而增强了标准的RAG流程。
5个技巧提升Dify知识库准确率:1)混合检索结合语义与关键词搜索,准确率提升40%;2)重排序技术精选最相关答案;3)文档预处理确保内容质量,包括格式统一和智能分段;4)定制提示词让AI更懂业务语言,准确率从72%提升至93%;5)建立持续优化闭环,通过监控指标和A/B测试迭代改进。实施后某企业回答准确率从65%跃升至92%,响应时间从25分钟缩短至30秒。
摘要:当前大语言模型智能体开发存在三大误区:过度追求多智能体协作的科幻式场景,实际应用中单线程工作更可靠;检索增强生成(RAG)理论优势明显但实用效果常不及传统检索方法;盲目堆砌指令反而导致模型性能下降。实践表明,成功的智能体开发应回归基础:确保单线程稳定运行、采用传统检索手段、精简指令设计。核心在于做好上下文工程,保持决策连贯性。2025年的模型已足够智能,无需复杂架构,简单的单线程智能体往往比
摘要:RAG(检索增强生成)通过结合大模型与外部数据,解决企业数据安全、训练成本、领域适配等痛点。其架构包含入库、输入、检索和生成模块,支持问答、总结等任务,广泛应用于金融、医疗等领域。目前大模型人才缺口巨大,学习资料包括路线图、实战项目、权威书籍和面试题,适合零基础入门。由清华-加州理工双料博士研发的系统课程,可帮助快速掌握大模型技术,扫描二维码免费领取学习资源。(150字)
GraphRAG(基于图的检索增强生成)就像是给你的AI装了一张知识地图,让它能自由导航。传统的AI系统,比如聊天机器人,通常靠简单搜索找答案。它们在文本堆里找关键词,有时候会漏掉整体的大局。GraphRAG通过将信息组织成一个知识图谱来改变这一现状——这是一个由节点(比如人、地点或事物)和它们之间的关系(比如“居住在”或“为某人工作”)构成的互联网络。想象一个社交网络:GraphRAG不仅知道“
Transformer架构:自注意力、多头注意力、残差连接、位置编码,提升序列建模能力。Token与上下文窗口:窗口决定信息处理长度,需合理分块,Chunking保证上下文连续。:Zero-shot、Few-shot、Chain-of-thought,Prompt模板化与Chaining提升适应性。业务场景:电商客服需分块长会话,Prompt设计直接影响问答效果。技术细节:合理分词、窗口管理、模板
机器学习面试核心知识点摘要 偏差与方差:偏差反映模型拟合能力,高偏差导致欠拟合;方差反映模型稳定性,高方差导致过拟合。需平衡两者以最小化总误差。 评估指标:分类问题常用准确率、精确率、召回率等,数据不均衡时准确率会失效,需用F1-Score等指标。 逻辑回归:通过线性加权和+Sigmoid函数输出概率值,虽用于分类但核心步骤基于回归思想。 决策树:递归选择最佳特征分割数据,ID3用信息增益,C4.
Spring AI: Spring生态系统中的AI集成框架: 现代化的Java应用开发框架: 响应式Web框架,提供更好的并发性能本文详细介绍了如何使用Spring AI和RAG技术构建企业级智能文档问答系统。通过结合向量数据库、语义检索和大语言模型,我们能够创建出既准确又高效的问答系统。支持多模态文档处理(图片、表格等)实现更精细的权限控制和审计日志集成更多的AI模型和算法优化系统性能和扩展性。
RAG技术结合大模型与外部数据,有效解决数据安全、成本高昂、领域知识不足、知识过时、幻觉问题和长尾知识覆盖有限等痛点。其架构包括入库、输入、检索和生成四大模块,检索采用多路召回策略,生成融合大模型输出。该技术可应用于补全、问答、总结等任务,在金融、医疗、法律等多个领域有广泛应用价值。
本文详解了如何通过强化学习(RL)增强传统RAG系统,构建智能自适应的Agentic RAG方案。文章从基础RAG流程出发,深入探讨了强化学习三要素(状态、动作、奖励)的设计与实现,包括改写查询、扩展/过滤上下文等核心动作函数,以及策略网络和训练循环构建。实验表明,RL增强型RAG相比基础RAG性能提升25%,显著提高了事实性查询的准确率与回答可靠性,为构建更智能的知识增强系统提供了有效路径。
文章介绍了信息检索技术如何解决大模型"胡说八道"的问题。通过RAG系统中的传统检索方法(TF-IDF、BM25、倒排索引)和向量检索技术(稠密向量、嵌入模型、向量数据库),以及混合检索策略,为AI装上"超级大脑",使其能够访问最新信息、查阅专业知识并引用准确来源,从根本上改变AI的运作规则,让有限模型拥有无限知识获取能力。
本文介绍了两种简化Claude Code MCP配置的方法:1)使用VS Code插件"Claude Code Chat"实现一键配置,内置常用MCP Servers并支持三种连接类型;2)原生命令行配置方法,详细说明了Stdio、SSE两种连接方式的命令语法及项目范围指定参数。重点推荐插件方案,通过可视化界面大幅降低配置难度,支持点击添加/删除MCP,无需记忆复杂命令,适合初
Spring AI: Spring生态系统中的AI集成框架RAG架构: 检索增强生成技术向量数据库Embedding模型: 后端开发框架本文详细介绍了基于Spring AI和RAG技术构建企业级智能文档问答系统的完整方案。通过结合向量数据库、语义检索和大型语言模型,我们能够构建出理解自然语言、提供准确答案的智能系统。多模态文档支持(图片、表格等)实时学习与模型更新更复杂的推理能力更好的幻觉抑制机制
本文介绍了一个六层架构的时序AI智能体系统,用于构建和管理动态知识库。该系统通过语义分块、原子事实提取、实体解析、时序失效处理、知识图构建和优化知识库六个模块,将原始动态文档转换为可查询的知识结构。系统采用基于百分位数的分块技术和结构化Pydantic模型提取事实,实现实体去重和冲突检测,构建支持时间演进的动态知识图。最后通过多智能体系统和LangGraph工作流验证系统性能,为金融分析、医疗健康
Datawhale开源项目happy-llm新增建筑文档智能RAG审查系统,针对传统人工审查效率低、错误率高的问题,提出动态语义知识分块与生成式知识引导检索两大创新。系统通过LLM模块、Embedding模块和文档预处理实现基础架构,结合动态语义分块、智能问题生成、知识引导检索和偏差分析等核心模块,实现建筑文档自动化合规性审查。项目提供完整源码,适合开发者从零构建专业领域RAG系统,可扩展至其他领
文章主要介绍了大模型本地部署的重要性和方法,重点讲解了ollama这一小巧简单的部署工具。文章详细说明了ollama的特点(多平台支持、多种交互接口)、安装步骤、模型下载方式以及API接口使用,帮助开发者在本地环境中快速部署大模型,特别适合学习和小规模开发测试使用。
Spring AI是Spring生态系统中的AI扩展框架,提供了统一的API来集成各种AI模型和服务。它支持多种AI提供商,包括OpenAI、Azure OpenAI、Amazon Bedrock等,同时提供了丰富的工具和组件来简化AI应用的开发。@Data@Data本文详细介绍了基于Spring AI和RAG技术构建企业级智能文档问答系统的完整方案。通过结合先进的AI技术和成熟的Spring生态
模型微调通常来说,虽然可以提高任务的效果,但通常来说,微调的成本远大于提示词调优,模型微调相对来说复杂性高、资源需求大而且成本高。
LangChain 作为目前最流行的大模型工程化框架之一,提供了从业务逻辑编排、工具调用、知识管理到多模型协作的完整解决方案。它不仅让大模型能够更好地落地企业应用,还为复杂多轮任务提供了可扩展、高性能的架构支持。希望大家带着下面的问题来学习,我会在文末给出答案。LangChain 的核心组件和 Agent 架构是如何设计的?LangChain 的 Memory 管理与知识库集成如何实现?LangC
本篇文章就让我们来看一下 LlamaIndex和Haystack 这两个框架,我简单的介绍一下架构设计,以及多框架集成和知识库动态管理实践,同时提供示例代码帮助你快速理解并上手做自己的小demo。
coze官宣开源,快来试试本地私有化部署coze,以后可以在本地电脑使用coze了,可用再受资源点限制。
本篇文章主要是教大家如何在本地部署的Dify进行配置自定义的大模型以及获取一些免费的大模型API Key
在GitHub上发现一个近乎完美的免费大语言模型课程,包含科学家和工程师双路径的详细学习路线,附带实战Notebook、论文资源和初学者所需的一切。
手把手教你使用 Ollama 本地部署 gpt-oss-20b 或 gpt-oss-120b,实现离线对话、API 调用,甚至连接到 Agents SDK。
LLaMA Factory 是一个开源的大模型微调与训练框架,主要围绕 Meta 发布的 LLaMA 系列模型 进行优化。
小白必看:什么是知识库(RAG)?一文看懂!
Spring AI: Spring生态系统中的AI集成框架RAG架构: 检索增强生成技术向量数据库Embedding模型: 后端开发框架Spring AI与RAG技术的结合为企业智能文档处理提供了强大的解决方案。通过本文介绍的架构设计和实现方案,开发者可以快速构建高效、准确的智能问答系统。随着AI技术的不断发展,这种架构还可以进一步扩展支持多模态、实时更新等高级特性。在实际应用中,建议从小的业务场
本文深入分析了RAG系统面临的安全威胁,特别是间接Prompt注入(IPI)攻击和数据外传通道。通过EchoLeak和AgentFlayer两个最新漏洞案例,揭示了攻击者如何通过隐藏指令和自动外传机制窃取企业敏感数据。文章强调传统安全假设的不足,并提出多层防御策略:输入净化、权限最小化、上下文隔离和输出拦截,为企业和开发者提供了一套完整的RAG安全防护框架。
我们今天就分享一个开源的可以本地运行的GPT,名称叫LocalGPT,看名字就知道是运行在本地的,我们详细介绍下。
智能体式RAG是将AI智能体能力融入检索增强生成(RAG)的前沿方法,主要在检索步骤中使用智能体。这些检索智能体具备规划、适应、工具使用和反思能力,使检索过程更加智能灵活。架构分为单智能体(作为路由器)和多智能体(由主智能体协调多个专业化智能体)。这种结合将RAG的信息检索能力与AI智能体的自主决策能力完美融合,能处理复杂动态查询,为构建下一代智能应用提供基础。
在RAG应用中通常需要对各种文档进行文本提取,如果稳定是纯文本那文档提取会简单很多,但通常文档中会存在各种图片信息,这时就需要使用OCR在提取文档文本信息的同时对图片进行OCR获取图片中的文本内容。本文只介绍PDF文档中OCR技术方案。PDF文档解析目前有不少开源框架亦可支持对PDF中的图片进行OCR,但此类框架通常比较重如Marker、Unstructured等。
如果你想建立一个属于自己的知识库,避免使用其他服务商提供的在线知识库导致资料泄露,那么在自己的电脑或自己搭建的服务器上安装部署RAGFlow是最好的选择。
RAG
——RAG
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net