登录社区云,与社区用户共同成长
邀请您加入社区
我们为你精选了 5 本兼具深度与实用性的 AI 工程书籍,覆盖从底层原理到云端部署的完整知识链。无论你是刚入门的新手,还是希望进阶的工程师,这些书都值得一读。
检索增强生成技术的发展,正在重构大语言模型与外部知识的交互方式,为 AI 应用的落地提供了更可靠、更灵活的技术路径。2025 年多模态融合、动态知识管理等核心突破,进一步拓宽了 RAG 的应用边界,使其从文本领域走向更复杂的真实场景。作为科研工作者,我们既要关注技术创新带来的性能提升,也要重视实际应用中的落地挑战。未来,随着算法优化、架构创新和行业实践的不断深入,RAG 技术必将在更多领域发挥核心
AI智能体(Agent)正迅速从前沿概念走向实际应用。要构建一个高效、可靠的智能体,离不开一系列核心技术的支撑。本文将对当前主流的8大核心技术进行解析,帮助大家全面理解其工作原理与应用价值。
在当今的人工智能时代,NLP技术已经深入渗透到我们日常生活的各个方面,从智能助手、语音识别到机器翻译和文本生成,NLP正在以令人瞩目的速度改变着我们的生活方式。
Function的调用时Agent实现很重要的一步,只有了解了这个原理才可以更好的创建Agent。
本文是台大教授李宏毅讲授AI Agent的爆火油管视频的文字稿。内容层层递进,是学习和理解AI Agent难得的好教材。
这是一个集成了几十种 LLM 应用场景的超全 demo 集,覆盖了几乎所有你能想到的 AI agent 使用场景。
Dify 是一个开源的大语言模型(LLM)应用开发平台,融合了后端即服务(Backend as a Service, BaaS)和 LLMOps 的理念,旨在帮助开发者快速构建和部署生成式 AI 应用。
Awesome LLM Apps 开源项目给出了一个极具参考价值的答案——它是一个精心策划的LLM应用集合,涵盖AI代理(AI Agents)、检索增强生成(RAG)和多模型集成,为开发者提供了从理论到实践的完整路径。
AI Engineering》这本书以其全面性、时效性、实用性和可读性,成为了AI/LLM时代每个从业者和爱好者的必读书籍
今天给大家推荐这个大模型入门学习项目,实在是太香了太香了,目前该项目已经超过3000星,具体的文章分类如下所示。
这波AI浪潮,很多新词把人都绕晕了,如AI Agent(人工智能代理)、RAG(检索增强生成)、向量知识库、提示词工程、数据提取和解析、自然语言处理(NLP)、知识图谱以及图处理等。本文试图深入探讨这些概念,让大家一下子就能分辨。
开箱即用:封装了完整的微调流程,无需手动实现训练循环自动生成训练数据:使用LLM自动生成问答对,大大降低数据准备成本灵活的模型支持:支持多种Embedding模型(BGE、OpenAI等)完善的评估工具:内置评估函数,方便对比不同模型效果通过本文的实战教程,我们完成了:✅ 从PDF文档自动生成训练数据✅ 使用LlamaIndex微调BGE模型✅ 评估并对比微调前后的效果无需人工标注,LLM自动生成
本文提出构建多模态运维Agent的创新思路,将可视化监控数据(时序图、拓扑图、抓包图)与日志文本结合,利用多模态大模型实现智能故障诊断。文章详细设计了系统架构,包含截图采集、上下文构建和多模态分析三大模块,并规范了输入输出接口。重点阐述了从Grafana等监控系统获取图表截图的技术方案,以及如何组织"图表+日志"的上下文信息。通过结构化Prompt设计,使Agent能输出包含异
今天,让我们深入剖析RAG技术的方方面面,从基础概念到高级优化,从理论原理到实战案例,帮你构建真正可用的企业级AI知识系统。
为了让大家全方位吃透AI Agent,还能积极投身到生态建设里,好多公司都纷纷甩出了官方智能体解读和白皮书。
本文介绍ICLR 2025论文《SePer》,提出用语义困惑度(SePer)评估检索增强生成(RAG)中检索对答案的实际效用。该方法通过对比检索前后语义簇分布的不确定性变化,比传统相关性指标更准确反映检索对答案生成的实质性帮助。实验显示SePer与检索效用的相关性(平均0.778)显著优于ROUGE-L/NDCG等基线,且采样10次即可稳定。研究发现无关检索会对大模型产生显著负面影响,SePer可
Agent Skills智能体技能:让AI成为你的"数字老师傅",小白也能轻松上手!
本文是一篇关于AI Agent记忆系统的权威综述,由NUS、人大、复旦等多所高校联合完成。采用"形态-功能-动力学"三维框架分析200+论文,提出Token-level、Parametric、Latent三大记忆形态,取代传统二分法。系统阐述记忆形成、演化与检索的完整生命周期,展望生成式记忆、自动记忆管理等七大前沿方向,并提供Benchmark与开源框架资源,为AI Agent记忆研究提供全面参考
本文系统梳理了RAG技术的最新发展,重点分析了5种主流范式(LLM-only、NaiveRAG等)的适用场景与性能表现,并介绍了AgenticRAG的创新A-RAG方案。研究基于RAGRouter-Bench数据集,通过分层检索工具和智能体循环机制,显著提升了多跳问答的准确性。文章为开发者提供了根据查询类型和语料特性选择RAG范式的实用建议,同时指出复杂范式需权衡效果与资源成本的考量要点。
Unsloth是一个专注于加速大语言模型微调过程的开源项目。它通过一系列底层优化,显著提升了微调速度并大幅降低了内存消耗,同时能保持模型性能。无论是研究者还是开发者,都能借助Unsloth更高效地定制自己的大语言模型。
我有幸邂逅了一本堪称“神级”的AI Agents最新图解指南,它就像一把重锤,彻底砸碎了我原有的认知体系,并重新构建起更为清晰、全面的知识框架~!
这份报告既涵盖了智能体应⽤层和模型基础设施层,⼀共 19 个技术领域的 135 个项⽬,又对大模型开发生态的七个趋势做了深度解读。
本文为技术内容,诸如 RAG、Agentic、Vector Database、SQL、Embedding、Cross-Encoder、LLM 等专业术语均保留英文原文,以保证准确性与可检索性。
今天就给大家盘点12个好用的平台,帮你快速入门AI应用构建。
在这个已经被AI大模型包围的时代,不了解一点大模型的基础知识和相关概念,可能出去聊天都接不上话。
RAG(Retrieval-Augmented Generation,检索增强生成)的思想就是将私有数据作为参考信息传递给LLM。这些私有数据除了作为一种补充信息,也可以作为一种限制,能避免LLM产生幻觉。
本文将从零到一地介绍如何使用LangChain构建从检索增强生成(RAG)到智能代理(Agent)的完整应用。
对于刚入门大模型的小白、想落地AI项目的程序员来说,RAG(检索增强生成)绝对是绕不开的核心技术——它的核心价值,正是通过“检索+生成”的双环节深度协同,从根源上解决大语言模型最让人头疼的“AI幻觉”痛点,让AI回答告别“胡编乱造”,变得精准可追溯。RAG的核心逻辑并不复杂:先将目标文档(PDF、手册、数据库等)拆分、转化为计算机可识别的向量形式并存储;
RAGRetrieval Augmented Generation,检索增强生成),本质是给LLM“装一个外部知识库”——让大模型在回答问题前,先从你指定的数据库中检索相关上下文,再结合自身能力生成答案,核心目的是提升回答的准确性、时效性和可信度。很多小白会疑惑:LLM已经训练了海量数据,为什么还需要RAG?关键问题在于:LLM的训练数据有时效性上限(比如训练到2023年,就无法回答2024、20
转行人有着不同面貌:那些想转行、但在风险面前迟疑的,那些下决心抛掉安稳、纵身一跃的,那些在尝试之后又返回原轨的……
本文深入探讨了AI大模型落地时RAG与微调的技术选型难题,强调不同行业(医疗、金融、电商)的适配性差异。文章详细解析了RAG(实时检索)和微调(专业知识学习)的原理及工具选型,如Milvus、Pinecone、Weaviate等向量库,以及LoRA、QLoRA等微调技术。通过3步决策法、3档预算方案和工具性能测试,为不同场景提供具体实施方案。最后展望了AI工具链平民化趋势,并分享了实操部署与成本控
AI产品经理是负责将人工智能技术整合到产品中的专业人士。与传统产品经理相比,AI产品经理不仅需要具备深厚的技术理解力,还需要能够将技术与市场需求紧密结合,创造出更有竞争力的产品。
大模型技术正通过RAG、Agent与多模态技术重塑AI交互边界。RAG解决模型知识静态、时效性及隐私问题;Agent赋予模型自主决策与多任务协同能力;多模态技术突破单一模态限制。三者协同演进攻克数据时效性、专业适配等难题,推动行业从效率革新到业务重构。文章解析技术演进脉络、实战经验与未来图景,为读者提供前沿趋势的全局视角与产业升级的实践指引。大模型技术正加速渗透至产业核心场景,成为驱动数字化转型的
对于想要突破职业瓶颈、抢占技术风口的程序员(尤其是编程小白、传统开发从业者)来说,AI大模型领域无疑是当下最值得深耕的赛道。本文专为程序员群体整理,详细拆解转型AI大模型的8大热门岗位,搭配从基础入门到项目落地的完整转行步骤,同时揭秘国内大模型人才缺口现状——2025年行业仍存在巨大职业红利,还附上可直接套用的系统学习资源。
本文将简要介绍企业如何通过一系列策略和步骤,在本地部署和利用大模型,构建企业本地垂直领域知识库。
DeepSeek-V3 是最新一代开源 AI 模型, 不仅完全兼容 OpenAI API,还能通过流式输出大幅提升性能和用户体验。
从整体上看,训练LLM主要包括两个关键阶段:预训练(Pre-training)后训练(Post-training):微调、RL和RLHF。上述流程整合了预训练、微调、RLHF等核心阶段,适用于自然语言处理和多模态大模型:1.数据准备数据收集:根据目标领域收集海量无标注数据(预训练)或少量标注数据(微调)。清洗与增强:去除噪声、重复项,进行分词/标准化(文本)或裁剪/旋转(图像)。划分数据集:预训练
本文通过天才学生的比喻生动阐释了大模型训练的四个关键阶段:1)预训练阶段(博览群书)通过Transformer等架构让模型掌握基础知识和逻辑;2)后训练与对齐阶段(规矩养成)利用SFT、RLHF等技术培养模型的对话能力和价值观;3)推理增强阶段(思维深度)采用CoT、ToT等方法提升模型解决复杂问题的能力;4)智能体阶段(实习干活)通过工具调用、RAG等技术赋予模型执行实际任务的能力。这种分阶段训
对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?答案只有一个:人工智能(尤其是大模型方向)当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应
大语言模型本质是对人脑神经网络的模拟,智能体记忆也可以通过模拟人脑记忆来实现更强的性能。人脑记忆结构记忆是人类编码、存储和提取信息的过程,使人类能够随着时间的推移保留经验、知识、技能和事实,是成长和有效与世界互动的基础。要弄清楚记忆的结构,需要搞明白记忆如何分类以及提供哪些操作。
RAG(检索增强生成)技术的核心价值,核心是通过“检索+生成”的双向协同模式,从根本上解决大语言模型最棘手的“AI幻觉”问题——也就是模型凭空编造信息、回答偏离事实的痛点。它的核心逻辑并不复杂:先将目标文档拆分、转化为计算机可识别的向量形式存储起来,当用户发起提问时,系统会优先从数据库中检索出最相关的资料,再依托这些真实、精准的素材,驱动大模型生成可靠回答。
本文系统介绍AI智能体的基本概念、特性、执行步骤与等级划分,详述21种设计模式包括提示链、路由、并行化等,并展示如何组合这些模式构建复杂系统。文章揭示了智能体从LLM演化而来的技术演进,强调多模式组合而非单一应用的设计理念,为开发者提供构建自主智能体的体系化工具箱,适合大模型学习与实践参考。
文章探讨了从传统RAG到Context Engineering的技术演进,指出AI应用正从单轮问答向多轮Agent发展。Milvus提出的向量数据湖通过湖仓一体架构,统一管理多模态上下文数据,支持混合搜索、多模态处理和动态管理。其创新包括存算分离、多引擎协同和智能冷热分层,解决了数据孤岛与扩展瓶颈,为下一代AI应用提供高效、灵活、可扩展的上下文基础设施。
本文介绍了基于RAG架构解决AI幻觉问题的技术方案,适用于Python开发者和AI应用开发者。文章分析了AI幻觉的三大技术根源:训练数据时效性限制、领域知识缺乏和无法访问实时数据。提出了结合Pangolinfo API获取亚马逊产品数据,使用Pinecone向量数据库存储检索,并通过LangChain构建增强上下文的解决方案。详细说明了从环境准备、核心模块实现到生产部署的全流程,包括性能优化和常见
本文介绍了如何通过偏好对齐(preference alignment)技术,使RAG模型从“不犯错”进阶到“更符合业务偏好”。作者提出在现有质量闭环系统基础上增加“偏好环”,通过质量事件自动生成(prompt, chosen, rejected)样本对,并采用DPO等轻量级RLHF方法进行微调。具体实现包括:1)设计偏好样本生成器,针对不同错误类型制定改进策略;2)构建标准化prompt格式;3)
本文提出了一套完整的RAG系统监督微调(SFT)方案,通过将质量事件自动转化为训练数据,实现系统自我优化。方案包含四个关键环节:1) 质量事件落盘存储低分样本;2) 基于错误标签自动清洗标注数据;3) 采用两种策略生成训练样本(prompt/completion对);4) 设计RAG专用训练策略,包括样本权重、标签权重和损失函数加权。特别针对RAG特有的错误类型(事实性、完整性、相关性、过度自信)
本文提出了一种将RAG系统中的低质量回答自动转化为可微调数据集的闭环方案,使模型能够通过持续学习不断提升性能。系统通过三类专用Agent(检索、解释、评估)识别低分样本并生成结构化质量事件,经过四个关键处理阶段:1)采集问题、文档、答案和评估结果;2)基于评估标签自动识别错误类型并生成纠正指令;3)构造包含prompt、completion和置信度评分的训练样本;4)将数据接入微调管道。该方案特别
本文提出为RAG系统构建质量保障闭环,在原有检索、解释、评估三类Agent基础上,增加自动质检和返修流程。核心流程包括:捕获低分回答作为质量事件,按错误标签分类,触发针对性修复策略(如重检索、调整Prompt等),并记录修复效果。通过SQLite存储反馈数据,后台Worker异步处理质量队列,实现评估→分类→修复→反馈的完整闭环。建议从小规模试点开始,逐步扩展策略复杂度,最终将修复数据用于系统优化
RAG
——RAG
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net