登录社区云,与社区用户共同成长
邀请您加入社区
本文将探索属性图及其在提升数据表示和检索中的作用,同时借鉴 Ravi Theja(LlamaIndex AI 工程师和布道师)关于属性图的系列内容。
知识需要不断的积累,才能有机会厚积薄发,肚子里面没有干货那是真的不行的,我们一起了解一下AI领域里的Langchain 和 RAG,它们到底是什么呢?
微调 LLaMA(Large Language Model Meta AI)大模型是一个重要的步骤,能够使模型适应特定的任务或数据集,提高其在特定应用场景下的表现。
本文从知识图谱的原理等角度,结合一个 GraphRAG 的生动类比,说明了为什么知识图谱+RAG 的方案优于传统的 RAG 方案。
如果你问一个通用的语言大模型,“我想下周一从北京飞往上海,看看上午的机票,最好是不用太早起床的航班,并且帮我选一个靠过道的位置。他可以给出比较精准的信息,不过说话方式会比较生硬,不像一个客服应该给出的回复,用户仍需要继续处理、消化,再做出选择。如果用户体验不佳,就还会寻求人工客服,这样一来企业的人力运营成本并不会减轻。这是因为我们的通用开源大模型虽然具备广泛的常识,但缺乏票务领域的专业知识(如航线
检索增强生成(RAG)技术通过整合外部知识库,为 LLMs 提供了额外的背景信息,有效地改善了模型的幻觉、领域知识不足等问题。
本文将深入探讨AI大模型在医疗十大场景中的创新实践,展示其提升医疗服务效率、赋能临床决策、推动行业智能化转型的广阔前景。
我将介绍一个基于 LangGraph 构建的全面 GraphRAG 多智能体系统,它作为一个智能的食物助手。
来了来了,最近很久没弄到新的大模型书籍了,今天给大家推荐这本—《基于大模型的RAG应用开发与优化——构建企业级LLM应用》(送PDF)
今天给大家推荐一本4月份才新出的大型语言模型(LLM)的权威教程《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》Google工程总监Antonio Gulli作序,一堆大佬推荐!这含金量不用多说。
本文旨在探讨这一过程,为读者提供一个从理论到实践的指南,帮助大家理解大模型部署的基本原理,以及如何克服资源限制,实现个人电脑上的初步应用尝试。
OpenAI 带你《从 0 到 1 打造 AI Agent:最全实战指南》(直白 + 权威)
今天我们就用最通俗的语言,结合生活中常见的例子,一次性说清楚这两个技术的区别和选择方法!
掌握State 的定义模式是开启 LangGraph 高阶开发的大门。通过TypedDict我们建立了一套可预测的数据契约。划重点:状态在任何给定时间只包含来自一个节点的更新信息,但 LangGraph 内部的合并机制让它看起来像一个全局共享池。
在进行微调之前,你需要准备一个合适的计算环境,并安装相关的依赖包。通常需要的依赖包括深度学习框架(如 PyTorch)、LLaMA 的相关库以及数据处理工具。
文章摘要:本文提出一套企业引入Agent技术的四阶段落地路线图:1)单点试验阶段,用最小成本验证Agent价值;2)场景化落地阶段,聚焦单一高价值场景深度打磨;3)体系化建设阶段,构建可复用的Agent基础设施;4)平台化阶段,打造企业级Agent能力中台。每个阶段都明确了核心目标、实施建议和需避免的过度设计,强调从"点"到"线"再到"面"
文档聚焦2024年6月至2025年9月的最新动态,覆盖技术、产业、人才等多维度,为开发者提供全景式洞察与实战指
本文聊聊 LLama-Factory,它是一个开源框架,这里头可以找到一系列预制的组件和模板,让你不用从零开始,就能训练出自己的语言模型(微调)。
图灵君也迫不及待地跟大家分享一波。其中包括未上市就爆火的大模型教程《从零开始构建大模型》
文档合规审核是指根据法律法规、行业规范或企业内部规则,对各种专业文件进行内容和格式检查,发现潜在违规或缺陷。
更大的浪潮正在涌来。脉脉高聘报告揭示,2025年以来,AI新发岗位量呈现爆发式增长,**7月同比增长超过10倍**,简历投递量增长11倍。而综合多方信息预测,未来由AI大模型直接或间接创造的新增岗位,将以百万计。对于每一位程序员和希望入局的转型者而言,这不再只是一项新技术,而是开启未来职业空间的**战略级钥匙**。
在运行时,使用相同的编码器模型将用户的查询向量化,使用这个向量在索引中进行搜索,确定前k个结果,从数据库中检索相应的文本块,并将它们作为大语言模型提示的上下文输入。
摘要: 多Agent架构适用于复杂任务、多专业领域协作或高扩展性需求的场景,而简单任务则更适合单体Agent+工具链的轻量方案。决策时应考虑三个维度:任务复杂度(是否可分解)、领域数量(是否需要多专长)和非功能约束(延迟、成本等)。典型适用多Agent的场景包括天然多角色的流程(如运维排障)、跨领域专家系统(如企业助手)和中台类可插拔扩展需求。建议采用渐进式演进路径:从单体Agent模块化开始,逐
从零开始,亲手开发你的第一个AI大模型!的最终篇。在第二篇的基础上配合 Gemini 大模型,实现智能 Agent 的工具链集成。
借助大语言模型(LLM),它可以精准处理各种复杂格式的数据,为用户提供可靠的问答服务,并附上详实的引用依据。
你要是使用公共AI处理就像把钥匙交给陌生人一样不放心,而DeepSeek就像把保险箱安在自己家!
美亚4.7分神作中文版!GitHub 41k星作者新书《大模型技术30讲》重磅来袭
这款开源人工智能模型,你可以进行微调、蒸馏并在任何地方部署。最新的指令调优模型有8B、70B和405B版本可供选择。
RAG 的成败不在大模型,而在系统工程。本文系统拆解生产级 RAG 架构的七大核心环节,揭示为何多数 Demo 级方案无法落地,并给出可工程化的实践路径。
摘要:中国科技大学与Metastone Technology联合提出的A-RAG框架对传统检索增强生成(RAG)技术进行了革新性升级。该技术通过赋予语言模型自主控制检索工具的能力,实现了动态检索策略选择和迭代信息收集。相比传统RAG的固定检索流程,A-RAG提供了关键词搜索、语义搜索和文本读取三种工具接口,在多跳问答任务中准确率提升10-20个百分点。该框架解决了传统RAG在检索维度单一、检索生成
无论是AutoGPT的自主任务完成,还是ChatGPT的插件生态,都在向我们展示:AI正在从“工具”向“伙伴”演进。
这个项目真心不错,结构化得特别好,把复杂的 LLM 领域拆解成了三个清晰的部分,对想系统学习的同学来说,简直是福音。
多数场景下,企业开发AI应用常面临:接入或扩展企业已有业务系统并加入AI功能;接入三方系统或AI应用;从0构建AI应用并接入已有业务数据。
最强编程Agent Claude Code结合最强国产开源模型GLM4.6部署教程
大模型训练成本很高,且在推理过程中需要大量的计算资源,为了能够实现大模型应用落地,需解决大模型推理成本、模型响应速度等问题,这就需要对大模型进行推理优化。
不用记复杂的学术定义,小白一句话读懂:Agentic RAG,就是融合了Agent自主能力的RAG。Agent的核心能力是“自主推理、自主规划、自主行动”,把这种能力融入到传统RAG中,让RAG不再是“被动检索的工具”,而是能“主动思考、灵活应对复杂任务”的系统——这就是Agentic RAG的本质。Agentic RAG就是将AI智能体的自主规划(如任务路由、行动步骤拆解、结果反思等)能力,融入
今天,我们将通过一份2025年AI Agent开发路线图,全面解析Agent开发领域的核心技术栈和发展路径。
本文在前期实践基础上,进一步补充和详细解读了使用 LLaMA Factory 工具,在国产DCU(海光 K100-AI)上对 Meta-Llama-3-8B-Instruct 模型进行 LoRA 微调、推理及导出各阶段的关键日志输出和核心测试信息。
RAG(Retrieval Augmented Generation,检索增强生成)技术,最早由Facebook(现Meta)在2020年发布的论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》中提出——可能很多新手会惊讶,这项现在看似“热门”的技术,其实早在4年前就已经诞生。这篇论文要解决的一个问题非常简单:如
文章介绍了AI Agent智能任务框架的设计与实践,阐述了从传统定时任务到智能订阅的范式演进,提出了基于事件驱动的智能任务系统架构。通过"分身"部署、状态机管理和多级缓存等技术,实现了AI Agent从"被动问答"到"主动服务"的转变,解决了高并发、长耗时任务等工程挑战,使AI Agent能够24小时不间断地为用户提供个性化服务。本篇导读在LLM驱动的应用进入深水区后,开发者们发现:即便Agent
我们将使用 Google 开源的 Agent Development Kit(ADK),结合 Gemini 大语言模型 和 MCP 工具协议,从零构建一个智能航班查询 Agent
自监督学习是一种机器学习范式,它不依赖人工标注的数据,而是通过数据自身提供的内在结构或隐藏信息来生成监督信号,从而进行模型训练。
在这篇文章中,我将带你系统梳理 LlamaIndex 的框架入门介绍、RAG全生命周期能力,以及那些在真实项目中能显著拉开效果差距的“黑科技”~
今天我们探讨一个话题:在大模型项目落地的过程中,如何判断是选择RAG还是微调。我相信这也是困扰很多朋友的问题。为了深入讨论这个话题,我首先跟大家对比一下RAG和微调的本质区别。
本文从零开始,带你避坑踩雷,5分钟搞定高性能环境,让大模型在你的电脑上“飞”起来!
嵌入(Embedding)技术不仅适用于文本数据,还可以用于图像、音频等多模态数据的表示。所以它被广泛应用于各类人工智能的任务中,比如图像检索、人脸识别、智能问答系统、推荐系统、企业知识库系统等。
本文以生动比喻系统介绍了LangChain知识体系框架。文章将大模型应用比作森林,LangChain则是导航地图和工具包。内容分为六个层级:1)底层基础(LLM、Prompt、Embedding);2)核心模式RAG(检索增强生成);3)开发框架(组件化设计、LCEL语法);4)高级编排(LangGraph状态图、代理工具);5)服务部署(LangServe API化);6)运维监控(LangSm
本文介绍了如何使用芝麻小客服+ChatWiki组合搭建RAG智能客服系统,解决传统客服痛点。通过全渠道接入、创建AI机器人并上传知识库实现RAG学习、分配渠道权限以及配置人机协同,实现7x24小时精准应答,降低人力成本并提升服务质量。
本文从人工智能的基本概念出发,详细介绍了狭义AI和通用AI的分类,以及机器学习、深度学习等核心技术方法。文章重点解析了当前最热门的三大AI概念:Agent(智能体)、RAG(检索增强生成)和多模态模型,阐述了它们各自的能力、核心组件、应用场景及代表产品,如阿里通义千问、字节豆包、月之暗面Kimi等。同时,文章还探讨了多模态模型在图文理解、文生图/视频、跨模态对齐与生成等方面的能力,并指出了当前技术
RAG
——RAG
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net