登录社区云,与社区用户共同成长
邀请您加入社区
摘要:多模态RAG系统通过融合文本、图像等异构数据,突破传统RAG的文本局限,实现更全面的信息处理。其实现流程包括文档解析、多模态嵌入融合和上下文构建三个核心环节,需解决跨模态对齐、语义关联等挑战。尽管面临工程落地难题,多模态RAG在工程设计图等场景已展现应用价值。随着AI大模型快速发展,掌握多模态技术将成为应对行业人才缺口的重要方向。(149字)
RAG系统对比研究:Enhanced与Agentic架构的实测分析 研究对比了两种检索增强生成(RAG)架构:规则化的Enhanced RAG与自主决策的Agentic RAG。实验显示,在金融等特定领域,Agentic的意图识别准确率高达98.8%,查询改写环节NDCG指标平均提升2.8点;但在开放域任务中,Enhanced的固定流程更稳定。成本方面,Agentic的token消耗是Enhanc
本文介绍了智能体(Agent)技术在大语言模型产业应用中的关键作用。文章指出,智能体通过记忆管理、工具学习和规划能力,有效连接AI与现实需求。然而,智能体开发面临资源消耗大、效率低等问题。通过优化框架和真实案例,如马来西亚诺丁汉大学的NOVA智能助手,展示了智能体在招生咨询等场景的应用。文章还探讨了记忆管理、工具学习和规划能力等技术要点,并提供了从实验室到生产环境的工程落地建议,强调数据质量、安全
先说我的经历,传统后端开发入职阿里,工作一年后转大模型应用层。两年Agent、RAG经验,拿到字节超30%涨幅Agent开发岗位offer。**第一阶段:**了解LLM能干啥,当API使用,Agent探索,这阶段提示词怎么写很值得学习,吴恩达的课程讲的很好推荐去学。**第二阶段:**了解LLM模型大致原理,Transformer模型基本原理,注意力机制,SFT,模型微调,Pytorch这种框架使用
RAG(Retrieval-Augmented Generation)通过结合信息检索和文本生成,有效解决了大模型的知识时效性和幻觉问题。文档预处理: 文本分块、嵌入向量化向量检索: 相似度搜索、重排序生成增强: 上下文注入、结果生成大模型应用开发是一个快速发展的领域,作为Java后端开发者转型AI工程,关键是要理解底层原理,掌握核心模式,并持续关注最新技术发展。通过系统性地掌握RAG优化、框架选
对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?答案只有一个:人工智能(尤其是大模型方向)当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应
本文介绍了如何在星图GPU平台上自动化部署通义千问3-Reranker-0.6B镜像,实现低资源环境下的文本重排序功能。该镜像专为4GB显存设备优化,适用于RAG系统中的检索结果精排场景,显著提升知识库问答与语义搜索的相关性与准确性。
本文介绍了如何在星图GPU平台上自动化部署通义千问3-Reranker-0.6B镜像,实现文本重排序功能。通过平台一键部署,开发者可快速构建RAG系统中的相关性精排模块,显著提升搜索与知识问答结果的准确率,适用于技术文档检索、智能客服应答等典型场景。
我们为你精选了 5 本兼具深度与实用性的 AI 工程书籍,覆盖从底层原理到云端部署的完整知识链。无论你是刚入门的新手,还是希望进阶的工程师,这些书都值得一读。
检索增强生成技术的发展,正在重构大语言模型与外部知识的交互方式,为 AI 应用的落地提供了更可靠、更灵活的技术路径。2025 年多模态融合、动态知识管理等核心突破,进一步拓宽了 RAG 的应用边界,使其从文本领域走向更复杂的真实场景。作为科研工作者,我们既要关注技术创新带来的性能提升,也要重视实际应用中的落地挑战。未来,随着算法优化、架构创新和行业实践的不断深入,RAG 技术必将在更多领域发挥核心
AI智能体(Agent)正迅速从前沿概念走向实际应用。要构建一个高效、可靠的智能体,离不开一系列核心技术的支撑。本文将对当前主流的8大核心技术进行解析,帮助大家全面理解其工作原理与应用价值。
在当今的人工智能时代,NLP技术已经深入渗透到我们日常生活的各个方面,从智能助手、语音识别到机器翻译和文本生成,NLP正在以令人瞩目的速度改变着我们的生活方式。
Function的调用时Agent实现很重要的一步,只有了解了这个原理才可以更好的创建Agent。
本文是台大教授李宏毅讲授AI Agent的爆火油管视频的文字稿。内容层层递进,是学习和理解AI Agent难得的好教材。
这是一个集成了几十种 LLM 应用场景的超全 demo 集,覆盖了几乎所有你能想到的 AI agent 使用场景。
Dify 是一个开源的大语言模型(LLM)应用开发平台,融合了后端即服务(Backend as a Service, BaaS)和 LLMOps 的理念,旨在帮助开发者快速构建和部署生成式 AI 应用。
Awesome LLM Apps 开源项目给出了一个极具参考价值的答案——它是一个精心策划的LLM应用集合,涵盖AI代理(AI Agents)、检索增强生成(RAG)和多模型集成,为开发者提供了从理论到实践的完整路径。
AI Engineering》这本书以其全面性、时效性、实用性和可读性,成为了AI/LLM时代每个从业者和爱好者的必读书籍
今天给大家推荐这个大模型入门学习项目,实在是太香了太香了,目前该项目已经超过3000星,具体的文章分类如下所示。
这波AI浪潮,很多新词把人都绕晕了,如AI Agent(人工智能代理)、RAG(检索增强生成)、向量知识库、提示词工程、数据提取和解析、自然语言处理(NLP)、知识图谱以及图处理等。本文试图深入探讨这些概念,让大家一下子就能分辨。
开箱即用:封装了完整的微调流程,无需手动实现训练循环自动生成训练数据:使用LLM自动生成问答对,大大降低数据准备成本灵活的模型支持:支持多种Embedding模型(BGE、OpenAI等)完善的评估工具:内置评估函数,方便对比不同模型效果通过本文的实战教程,我们完成了:✅ 从PDF文档自动生成训练数据✅ 使用LlamaIndex微调BGE模型✅ 评估并对比微调前后的效果无需人工标注,LLM自动生成
本文提出构建多模态运维Agent的创新思路,将可视化监控数据(时序图、拓扑图、抓包图)与日志文本结合,利用多模态大模型实现智能故障诊断。文章详细设计了系统架构,包含截图采集、上下文构建和多模态分析三大模块,并规范了输入输出接口。重点阐述了从Grafana等监控系统获取图表截图的技术方案,以及如何组织"图表+日志"的上下文信息。通过结构化Prompt设计,使Agent能输出包含异
今天,让我们深入剖析RAG技术的方方面面,从基础概念到高级优化,从理论原理到实战案例,帮你构建真正可用的企业级AI知识系统。
为了让大家全方位吃透AI Agent,还能积极投身到生态建设里,好多公司都纷纷甩出了官方智能体解读和白皮书。
本文介绍ICLR 2025论文《SePer》,提出用语义困惑度(SePer)评估检索增强生成(RAG)中检索对答案的实际效用。该方法通过对比检索前后语义簇分布的不确定性变化,比传统相关性指标更准确反映检索对答案生成的实质性帮助。实验显示SePer与检索效用的相关性(平均0.778)显著优于ROUGE-L/NDCG等基线,且采样10次即可稳定。研究发现无关检索会对大模型产生显著负面影响,SePer可
Agent Skills智能体技能:让AI成为你的"数字老师傅",小白也能轻松上手!
本文是一篇关于AI Agent记忆系统的权威综述,由NUS、人大、复旦等多所高校联合完成。采用"形态-功能-动力学"三维框架分析200+论文,提出Token-level、Parametric、Latent三大记忆形态,取代传统二分法。系统阐述记忆形成、演化与检索的完整生命周期,展望生成式记忆、自动记忆管理等七大前沿方向,并提供Benchmark与开源框架资源,为AI Agent记忆研究提供全面参考
本文系统梳理了RAG技术的最新发展,重点分析了5种主流范式(LLM-only、NaiveRAG等)的适用场景与性能表现,并介绍了AgenticRAG的创新A-RAG方案。研究基于RAGRouter-Bench数据集,通过分层检索工具和智能体循环机制,显著提升了多跳问答的准确性。文章为开发者提供了根据查询类型和语料特性选择RAG范式的实用建议,同时指出复杂范式需权衡效果与资源成本的考量要点。
Unsloth是一个专注于加速大语言模型微调过程的开源项目。它通过一系列底层优化,显著提升了微调速度并大幅降低了内存消耗,同时能保持模型性能。无论是研究者还是开发者,都能借助Unsloth更高效地定制自己的大语言模型。
我有幸邂逅了一本堪称“神级”的AI Agents最新图解指南,它就像一把重锤,彻底砸碎了我原有的认知体系,并重新构建起更为清晰、全面的知识框架~!
这份报告既涵盖了智能体应⽤层和模型基础设施层,⼀共 19 个技术领域的 135 个项⽬,又对大模型开发生态的七个趋势做了深度解读。
本文为技术内容,诸如 RAG、Agentic、Vector Database、SQL、Embedding、Cross-Encoder、LLM 等专业术语均保留英文原文,以保证准确性与可检索性。
今天就给大家盘点12个好用的平台,帮你快速入门AI应用构建。
在这个已经被AI大模型包围的时代,不了解一点大模型的基础知识和相关概念,可能出去聊天都接不上话。
RAG(Retrieval-Augmented Generation,检索增强生成)的思想就是将私有数据作为参考信息传递给LLM。这些私有数据除了作为一种补充信息,也可以作为一种限制,能避免LLM产生幻觉。
本文将从零到一地介绍如何使用LangChain构建从检索增强生成(RAG)到智能代理(Agent)的完整应用。
对于刚入门大模型的小白、想落地AI项目的程序员来说,RAG(检索增强生成)绝对是绕不开的核心技术——它的核心价值,正是通过“检索+生成”的双环节深度协同,从根源上解决大语言模型最让人头疼的“AI幻觉”痛点,让AI回答告别“胡编乱造”,变得精准可追溯。RAG的核心逻辑并不复杂:先将目标文档(PDF、手册、数据库等)拆分、转化为计算机可识别的向量形式并存储;
RAGRetrieval Augmented Generation,检索增强生成),本质是给LLM“装一个外部知识库”——让大模型在回答问题前,先从你指定的数据库中检索相关上下文,再结合自身能力生成答案,核心目的是提升回答的准确性、时效性和可信度。很多小白会疑惑:LLM已经训练了海量数据,为什么还需要RAG?关键问题在于:LLM的训练数据有时效性上限(比如训练到2023年,就无法回答2024、20
转行人有着不同面貌:那些想转行、但在风险面前迟疑的,那些下决心抛掉安稳、纵身一跃的,那些在尝试之后又返回原轨的……
本文深入探讨了AI大模型落地时RAG与微调的技术选型难题,强调不同行业(医疗、金融、电商)的适配性差异。文章详细解析了RAG(实时检索)和微调(专业知识学习)的原理及工具选型,如Milvus、Pinecone、Weaviate等向量库,以及LoRA、QLoRA等微调技术。通过3步决策法、3档预算方案和工具性能测试,为不同场景提供具体实施方案。最后展望了AI工具链平民化趋势,并分享了实操部署与成本控
AI产品经理是负责将人工智能技术整合到产品中的专业人士。与传统产品经理相比,AI产品经理不仅需要具备深厚的技术理解力,还需要能够将技术与市场需求紧密结合,创造出更有竞争力的产品。
大模型技术正通过RAG、Agent与多模态技术重塑AI交互边界。RAG解决模型知识静态、时效性及隐私问题;Agent赋予模型自主决策与多任务协同能力;多模态技术突破单一模态限制。三者协同演进攻克数据时效性、专业适配等难题,推动行业从效率革新到业务重构。文章解析技术演进脉络、实战经验与未来图景,为读者提供前沿趋势的全局视角与产业升级的实践指引。大模型技术正加速渗透至产业核心场景,成为驱动数字化转型的
对于想要突破职业瓶颈、抢占技术风口的程序员(尤其是编程小白、传统开发从业者)来说,AI大模型领域无疑是当下最值得深耕的赛道。本文专为程序员群体整理,详细拆解转型AI大模型的8大热门岗位,搭配从基础入门到项目落地的完整转行步骤,同时揭秘国内大模型人才缺口现状——2025年行业仍存在巨大职业红利,还附上可直接套用的系统学习资源。
本文将简要介绍企业如何通过一系列策略和步骤,在本地部署和利用大模型,构建企业本地垂直领域知识库。
DeepSeek-V3 是最新一代开源 AI 模型, 不仅完全兼容 OpenAI API,还能通过流式输出大幅提升性能和用户体验。
从整体上看,训练LLM主要包括两个关键阶段:预训练(Pre-training)后训练(Post-training):微调、RL和RLHF。上述流程整合了预训练、微调、RLHF等核心阶段,适用于自然语言处理和多模态大模型:1.数据准备数据收集:根据目标领域收集海量无标注数据(预训练)或少量标注数据(微调)。清洗与增强:去除噪声、重复项,进行分词/标准化(文本)或裁剪/旋转(图像)。划分数据集:预训练
本文通过天才学生的比喻生动阐释了大模型训练的四个关键阶段:1)预训练阶段(博览群书)通过Transformer等架构让模型掌握基础知识和逻辑;2)后训练与对齐阶段(规矩养成)利用SFT、RLHF等技术培养模型的对话能力和价值观;3)推理增强阶段(思维深度)采用CoT、ToT等方法提升模型解决复杂问题的能力;4)智能体阶段(实习干活)通过工具调用、RAG等技术赋予模型执行实际任务的能力。这种分阶段训
大语言模型本质是对人脑神经网络的模拟,智能体记忆也可以通过模拟人脑记忆来实现更强的性能。人脑记忆结构记忆是人类编码、存储和提取信息的过程,使人类能够随着时间的推移保留经验、知识、技能和事实,是成长和有效与世界互动的基础。要弄清楚记忆的结构,需要搞明白记忆如何分类以及提供哪些操作。
RAG(检索增强生成)技术的核心价值,核心是通过“检索+生成”的双向协同模式,从根本上解决大语言模型最棘手的“AI幻觉”问题——也就是模型凭空编造信息、回答偏离事实的痛点。它的核心逻辑并不复杂:先将目标文档拆分、转化为计算机可识别的向量形式存储起来,当用户发起提问时,系统会优先从数据库中检索出最相关的资料,再依托这些真实、精准的素材,驱动大模型生成可靠回答。
RAG
——RAG
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net