登录社区云,与社区用户共同成长
邀请您加入社区
RAG 的成败不在大模型,而在系统工程。本文系统拆解生产级 RAG 架构的七大核心环节,揭示为何多数 Demo 级方案无法落地,并给出可工程化的实践路径。
摘要:中国科技大学与Metastone Technology联合提出的A-RAG框架对传统检索增强生成(RAG)技术进行了革新性升级。该技术通过赋予语言模型自主控制检索工具的能力,实现了动态检索策略选择和迭代信息收集。相比传统RAG的固定检索流程,A-RAG提供了关键词搜索、语义搜索和文本读取三种工具接口,在多跳问答任务中准确率提升10-20个百分点。该框架解决了传统RAG在检索维度单一、检索生成
无论是AutoGPT的自主任务完成,还是ChatGPT的插件生态,都在向我们展示:AI正在从“工具”向“伙伴”演进。
这个项目真心不错,结构化得特别好,把复杂的 LLM 领域拆解成了三个清晰的部分,对想系统学习的同学来说,简直是福音。
多数场景下,企业开发AI应用常面临:接入或扩展企业已有业务系统并加入AI功能;接入三方系统或AI应用;从0构建AI应用并接入已有业务数据。
最强编程Agent Claude Code结合最强国产开源模型GLM4.6部署教程
大模型训练成本很高,且在推理过程中需要大量的计算资源,为了能够实现大模型应用落地,需解决大模型推理成本、模型响应速度等问题,这就需要对大模型进行推理优化。
不用记复杂的学术定义,小白一句话读懂:Agentic RAG,就是融合了Agent自主能力的RAG。Agent的核心能力是“自主推理、自主规划、自主行动”,把这种能力融入到传统RAG中,让RAG不再是“被动检索的工具”,而是能“主动思考、灵活应对复杂任务”的系统——这就是Agentic RAG的本质。Agentic RAG就是将AI智能体的自主规划(如任务路由、行动步骤拆解、结果反思等)能力,融入
今天,我们将通过一份2025年AI Agent开发路线图,全面解析Agent开发领域的核心技术栈和发展路径。
本文在前期实践基础上,进一步补充和详细解读了使用 LLaMA Factory 工具,在国产DCU(海光 K100-AI)上对 Meta-Llama-3-8B-Instruct 模型进行 LoRA 微调、推理及导出各阶段的关键日志输出和核心测试信息。
RAG(Retrieval Augmented Generation,检索增强生成)技术,最早由Facebook(现Meta)在2020年发布的论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》中提出——可能很多新手会惊讶,这项现在看似“热门”的技术,其实早在4年前就已经诞生。这篇论文要解决的一个问题非常简单:如
文章介绍了AI Agent智能任务框架的设计与实践,阐述了从传统定时任务到智能订阅的范式演进,提出了基于事件驱动的智能任务系统架构。通过"分身"部署、状态机管理和多级缓存等技术,实现了AI Agent从"被动问答"到"主动服务"的转变,解决了高并发、长耗时任务等工程挑战,使AI Agent能够24小时不间断地为用户提供个性化服务。本篇导读在LLM驱动的应用进入深水区后,开发者们发现:即便Agent
我们将使用 Google 开源的 Agent Development Kit(ADK),结合 Gemini 大语言模型 和 MCP 工具协议,从零构建一个智能航班查询 Agent
自监督学习是一种机器学习范式,它不依赖人工标注的数据,而是通过数据自身提供的内在结构或隐藏信息来生成监督信号,从而进行模型训练。
在这篇文章中,我将带你系统梳理 LlamaIndex 的框架入门介绍、RAG全生命周期能力,以及那些在真实项目中能显著拉开效果差距的“黑科技”~
今天我们探讨一个话题:在大模型项目落地的过程中,如何判断是选择RAG还是微调。我相信这也是困扰很多朋友的问题。为了深入讨论这个话题,我首先跟大家对比一下RAG和微调的本质区别。
本文从零开始,带你避坑踩雷,5分钟搞定高性能环境,让大模型在你的电脑上“飞”起来!
嵌入(Embedding)技术不仅适用于文本数据,还可以用于图像、音频等多模态数据的表示。所以它被广泛应用于各类人工智能的任务中,比如图像检索、人脸识别、智能问答系统、推荐系统、企业知识库系统等。
本文以生动比喻系统介绍了LangChain知识体系框架。文章将大模型应用比作森林,LangChain则是导航地图和工具包。内容分为六个层级:1)底层基础(LLM、Prompt、Embedding);2)核心模式RAG(检索增强生成);3)开发框架(组件化设计、LCEL语法);4)高级编排(LangGraph状态图、代理工具);5)服务部署(LangServe API化);6)运维监控(LangSm
本文介绍了如何使用芝麻小客服+ChatWiki组合搭建RAG智能客服系统,解决传统客服痛点。通过全渠道接入、创建AI机器人并上传知识库实现RAG学习、分配渠道权限以及配置人机协同,实现7x24小时精准应答,降低人力成本并提升服务质量。
本文从人工智能的基本概念出发,详细介绍了狭义AI和通用AI的分类,以及机器学习、深度学习等核心技术方法。文章重点解析了当前最热门的三大AI概念:Agent(智能体)、RAG(检索增强生成)和多模态模型,阐述了它们各自的能力、核心组件、应用场景及代表产品,如阿里通义千问、字节豆包、月之暗面Kimi等。同时,文章还探讨了多模态模型在图文理解、文生图/视频、跨模态对齐与生成等方面的能力,并指出了当前技术
将非结构化文档转化为高质量、结构化、大模型友好的数据,已成为企业升级AI文档中台的关键能力
本书由 Jay Alammar 与 Maarten Grootendorst 联袂创作,两位在大模型与自然语言处理领域具有广泛影响力的专家,内容融合广受欢迎的图解系列精华,一经推出便获得业内高度评价。
Agent Skills是一种标准化格式,旨在为AI智能体提供专业知识和工作流程。它通过“技能包”机制,将指令、脚本和资源组织成文件夹,使智能体能自动发现并执行,提升工作效率。Agent Skills解决了AI在领域专业知识、组织特定上下文和可重复工作流程方面的不足,避免了提示词漂移、工作流约定丢失和指令膨胀等问题。它具有领域专业化、能力扩展、可重复工作流和跨平台互操作性的核心价值,适用于代码审查
RAGFlow 是 infiniflow 团队开源的一款 基于深度文档理解的 RAG(Retrieval-Augmented Generation)引擎。
对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?答案只有一个:人工智能(尤其是大模型方向)当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应
在当前LLM(大型语言模型)的应用浪潮中,检索增强生成(RAG)已成为相对成熟且应用最广的落地模式之一。但无论是从最初的Naive RAG演进到Advanced RAG,还是最新的Agentic RAG,其核心都离不开一个关键底座:知识库管理系统。
如果你想玩转当前所有主流的扩散模型(无论是 Stable Diffusion、ControlNet,还是最新的 SDE/ODE 模型),这个库是绕不过去的。它在易用性(Usability)和简洁性(Simplicity)上做到了极致。
本文详细介绍了RAG系统中核心的Embedding和Rerank模型。Embedding模型负责将文本向量化以进行相似度检索,而Rerank模型则在检索基础上进一步精确排序,提升相关性。文章从功能目标、应用阶段和技术实现三个维度对比了两种模型,并辅以实例说明,适合初学者和程序员学习大模型基础知识。Embedding和Rerank模型是RAG系统中的核心模型。在RAG系统中,有两个非常重要的模型一个
LightRAG 是由香港大学数据智能系统实验室(HKUDS)开源的 轻量级检索增强生成框架,专注于把大型语言模型(LLM)与外部知识库高效、可扩展地结合在一起。
LangGraph 基于 LangChain 之上,是一个基更高级的 AI Agent 编排框架,可以处理复杂的 Workflow 编排和 Multi-Agent 编排。
这是一个RAG系统,能把扫描的法律文件分块、嵌入到本地的FAISS索引中,在查询时做最近邻检索,把排名靠前的、带引用的上下文喂给Claude,生成事实准确、带来源的答案,而且所有数据从没离开过事务所的网络。
今天为大家介绍的是Qwen3与MCP服务结合,实现Excel数据的可视化。在日常工作和生活中,我们经常会遇到各种数据处理需求。
不需要你懂 AI,即便你是一个刚入门的“小白”,在这里也能够跟着教程一步步学会并构建属于自己的大模型
LangChain 是一个开源的开发框架,旨在帮助开发者更轻松、更高效地构建基于大型语言模型 (LLM) 的应用程序。你
摘要:多模态RAG系统通过融合文本、图像等异构数据,突破传统RAG的文本局限,实现更全面的信息处理。其实现流程包括文档解析、多模态嵌入融合和上下文构建三个核心环节,需解决跨模态对齐、语义关联等挑战。尽管面临工程落地难题,多模态RAG在工程设计图等场景已展现应用价值。随着AI大模型快速发展,掌握多模态技术将成为应对行业人才缺口的重要方向。(149字)
RAG系统对比研究:Enhanced与Agentic架构的实测分析 研究对比了两种检索增强生成(RAG)架构:规则化的Enhanced RAG与自主决策的Agentic RAG。实验显示,在金融等特定领域,Agentic的意图识别准确率高达98.8%,查询改写环节NDCG指标平均提升2.8点;但在开放域任务中,Enhanced的固定流程更稳定。成本方面,Agentic的token消耗是Enhanc
本文介绍了智能体(Agent)技术在大语言模型产业应用中的关键作用。文章指出,智能体通过记忆管理、工具学习和规划能力,有效连接AI与现实需求。然而,智能体开发面临资源消耗大、效率低等问题。通过优化框架和真实案例,如马来西亚诺丁汉大学的NOVA智能助手,展示了智能体在招生咨询等场景的应用。文章还探讨了记忆管理、工具学习和规划能力等技术要点,并提供了从实验室到生产环境的工程落地建议,强调数据质量、安全
先说我的经历,传统后端开发入职阿里,工作一年后转大模型应用层。两年Agent、RAG经验,拿到字节超30%涨幅Agent开发岗位offer。**第一阶段:**了解LLM能干啥,当API使用,Agent探索,这阶段提示词怎么写很值得学习,吴恩达的课程讲的很好推荐去学。**第二阶段:**了解LLM模型大致原理,Transformer模型基本原理,注意力机制,SFT,模型微调,Pytorch这种框架使用
RAG(Retrieval-Augmented Generation)通过结合信息检索和文本生成,有效解决了大模型的知识时效性和幻觉问题。文档预处理: 文本分块、嵌入向量化向量检索: 相似度搜索、重排序生成增强: 上下文注入、结果生成大模型应用开发是一个快速发展的领域,作为Java后端开发者转型AI工程,关键是要理解底层原理,掌握核心模式,并持续关注最新技术发展。通过系统性地掌握RAG优化、框架选
本文介绍了如何在星图GPU平台上自动化部署通义千问3-Reranker-0.6B镜像,实现低资源环境下的文本重排序功能。该镜像专为4GB显存设备优化,适用于RAG系统中的检索结果精排场景,显著提升知识库问答与语义搜索的相关性与准确性。
本文介绍了如何在星图GPU平台上自动化部署通义千问3-Reranker-0.6B镜像,实现文本重排序功能。通过平台一键部署,开发者可快速构建RAG系统中的相关性精排模块,显著提升搜索与知识问答结果的准确率,适用于技术文档检索、智能客服应答等典型场景。
我们为你精选了 5 本兼具深度与实用性的 AI 工程书籍,覆盖从底层原理到云端部署的完整知识链。无论你是刚入门的新手,还是希望进阶的工程师,这些书都值得一读。
检索增强生成技术的发展,正在重构大语言模型与外部知识的交互方式,为 AI 应用的落地提供了更可靠、更灵活的技术路径。2025 年多模态融合、动态知识管理等核心突破,进一步拓宽了 RAG 的应用边界,使其从文本领域走向更复杂的真实场景。作为科研工作者,我们既要关注技术创新带来的性能提升,也要重视实际应用中的落地挑战。未来,随着算法优化、架构创新和行业实践的不断深入,RAG 技术必将在更多领域发挥核心
AI智能体(Agent)正迅速从前沿概念走向实际应用。要构建一个高效、可靠的智能体,离不开一系列核心技术的支撑。本文将对当前主流的8大核心技术进行解析,帮助大家全面理解其工作原理与应用价值。
在当今的人工智能时代,NLP技术已经深入渗透到我们日常生活的各个方面,从智能助手、语音识别到机器翻译和文本生成,NLP正在以令人瞩目的速度改变着我们的生活方式。
RAG
——RAG
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net