登录社区云,与社区用户共同成长
邀请您加入社区
自监督学习是一种机器学习范式,它不依赖人工标注的数据,而是通过数据自身提供的内在结构或隐藏信息来生成监督信号,从而进行模型训练。
在这篇文章中,我将带你系统梳理 LlamaIndex 的框架入门介绍、RAG全生命周期能力,以及那些在真实项目中能显著拉开效果差距的“黑科技”~
今天我们探讨一个话题:在大模型项目落地的过程中,如何判断是选择RAG还是微调。我相信这也是困扰很多朋友的问题。为了深入讨论这个话题,我首先跟大家对比一下RAG和微调的本质区别。
本文从零开始,带你避坑踩雷,5分钟搞定高性能环境,让大模型在你的电脑上“飞”起来!
嵌入(Embedding)技术不仅适用于文本数据,还可以用于图像、音频等多模态数据的表示。所以它被广泛应用于各类人工智能的任务中,比如图像检索、人脸识别、智能问答系统、推荐系统、企业知识库系统等。
本文以生动比喻系统介绍了LangChain知识体系框架。文章将大模型应用比作森林,LangChain则是导航地图和工具包。内容分为六个层级:1)底层基础(LLM、Prompt、Embedding);2)核心模式RAG(检索增强生成);3)开发框架(组件化设计、LCEL语法);4)高级编排(LangGraph状态图、代理工具);5)服务部署(LangServe API化);6)运维监控(LangSm
本文介绍了如何使用芝麻小客服+ChatWiki组合搭建RAG智能客服系统,解决传统客服痛点。通过全渠道接入、创建AI机器人并上传知识库实现RAG学习、分配渠道权限以及配置人机协同,实现7x24小时精准应答,降低人力成本并提升服务质量。
本文从人工智能的基本概念出发,详细介绍了狭义AI和通用AI的分类,以及机器学习、深度学习等核心技术方法。文章重点解析了当前最热门的三大AI概念:Agent(智能体)、RAG(检索增强生成)和多模态模型,阐述了它们各自的能力、核心组件、应用场景及代表产品,如阿里通义千问、字节豆包、月之暗面Kimi等。同时,文章还探讨了多模态模型在图文理解、文生图/视频、跨模态对齐与生成等方面的能力,并指出了当前技术
将非结构化文档转化为高质量、结构化、大模型友好的数据,已成为企业升级AI文档中台的关键能力
本书由 Jay Alammar 与 Maarten Grootendorst 联袂创作,两位在大模型与自然语言处理领域具有广泛影响力的专家,内容融合广受欢迎的图解系列精华,一经推出便获得业内高度评价。
Agent Skills是一种标准化格式,旨在为AI智能体提供专业知识和工作流程。它通过“技能包”机制,将指令、脚本和资源组织成文件夹,使智能体能自动发现并执行,提升工作效率。Agent Skills解决了AI在领域专业知识、组织特定上下文和可重复工作流程方面的不足,避免了提示词漂移、工作流约定丢失和指令膨胀等问题。它具有领域专业化、能力扩展、可重复工作流和跨平台互操作性的核心价值,适用于代码审查
RAGFlow 是 infiniflow 团队开源的一款 基于深度文档理解的 RAG(Retrieval-Augmented Generation)引擎。
对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?答案只有一个:人工智能(尤其是大模型方向)当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应
在当前LLM(大型语言模型)的应用浪潮中,检索增强生成(RAG)已成为相对成熟且应用最广的落地模式之一。但无论是从最初的Naive RAG演进到Advanced RAG,还是最新的Agentic RAG,其核心都离不开一个关键底座:知识库管理系统。
如果你想玩转当前所有主流的扩散模型(无论是 Stable Diffusion、ControlNet,还是最新的 SDE/ODE 模型),这个库是绕不过去的。它在易用性(Usability)和简洁性(Simplicity)上做到了极致。
本文详细介绍了RAG系统中核心的Embedding和Rerank模型。Embedding模型负责将文本向量化以进行相似度检索,而Rerank模型则在检索基础上进一步精确排序,提升相关性。文章从功能目标、应用阶段和技术实现三个维度对比了两种模型,并辅以实例说明,适合初学者和程序员学习大模型基础知识。Embedding和Rerank模型是RAG系统中的核心模型。在RAG系统中,有两个非常重要的模型一个
LightRAG 是由香港大学数据智能系统实验室(HKUDS)开源的 轻量级检索增强生成框架,专注于把大型语言模型(LLM)与外部知识库高效、可扩展地结合在一起。
LangGraph 基于 LangChain 之上,是一个基更高级的 AI Agent 编排框架,可以处理复杂的 Workflow 编排和 Multi-Agent 编排。
这是一个RAG系统,能把扫描的法律文件分块、嵌入到本地的FAISS索引中,在查询时做最近邻检索,把排名靠前的、带引用的上下文喂给Claude,生成事实准确、带来源的答案,而且所有数据从没离开过事务所的网络。
今天为大家介绍的是Qwen3与MCP服务结合,实现Excel数据的可视化。在日常工作和生活中,我们经常会遇到各种数据处理需求。
不需要你懂 AI,即便你是一个刚入门的“小白”,在这里也能够跟着教程一步步学会并构建属于自己的大模型
LangChain 是一个开源的开发框架,旨在帮助开发者更轻松、更高效地构建基于大型语言模型 (LLM) 的应用程序。你
摘要:多模态RAG系统通过融合文本、图像等异构数据,突破传统RAG的文本局限,实现更全面的信息处理。其实现流程包括文档解析、多模态嵌入融合和上下文构建三个核心环节,需解决跨模态对齐、语义关联等挑战。尽管面临工程落地难题,多模态RAG在工程设计图等场景已展现应用价值。随着AI大模型快速发展,掌握多模态技术将成为应对行业人才缺口的重要方向。(149字)
RAG系统对比研究:Enhanced与Agentic架构的实测分析 研究对比了两种检索增强生成(RAG)架构:规则化的Enhanced RAG与自主决策的Agentic RAG。实验显示,在金融等特定领域,Agentic的意图识别准确率高达98.8%,查询改写环节NDCG指标平均提升2.8点;但在开放域任务中,Enhanced的固定流程更稳定。成本方面,Agentic的token消耗是Enhanc
本文介绍了智能体(Agent)技术在大语言模型产业应用中的关键作用。文章指出,智能体通过记忆管理、工具学习和规划能力,有效连接AI与现实需求。然而,智能体开发面临资源消耗大、效率低等问题。通过优化框架和真实案例,如马来西亚诺丁汉大学的NOVA智能助手,展示了智能体在招生咨询等场景的应用。文章还探讨了记忆管理、工具学习和规划能力等技术要点,并提供了从实验室到生产环境的工程落地建议,强调数据质量、安全
先说我的经历,传统后端开发入职阿里,工作一年后转大模型应用层。两年Agent、RAG经验,拿到字节超30%涨幅Agent开发岗位offer。**第一阶段:**了解LLM能干啥,当API使用,Agent探索,这阶段提示词怎么写很值得学习,吴恩达的课程讲的很好推荐去学。**第二阶段:**了解LLM模型大致原理,Transformer模型基本原理,注意力机制,SFT,模型微调,Pytorch这种框架使用
RAG(Retrieval-Augmented Generation)通过结合信息检索和文本生成,有效解决了大模型的知识时效性和幻觉问题。文档预处理: 文本分块、嵌入向量化向量检索: 相似度搜索、重排序生成增强: 上下文注入、结果生成大模型应用开发是一个快速发展的领域,作为Java后端开发者转型AI工程,关键是要理解底层原理,掌握核心模式,并持续关注最新技术发展。通过系统性地掌握RAG优化、框架选
本文介绍了如何在星图GPU平台上自动化部署通义千问3-Reranker-0.6B镜像,实现低资源环境下的文本重排序功能。该镜像专为4GB显存设备优化,适用于RAG系统中的检索结果精排场景,显著提升知识库问答与语义搜索的相关性与准确性。
本文介绍了如何在星图GPU平台上自动化部署通义千问3-Reranker-0.6B镜像,实现文本重排序功能。通过平台一键部署,开发者可快速构建RAG系统中的相关性精排模块,显著提升搜索与知识问答结果的准确率,适用于技术文档检索、智能客服应答等典型场景。
我们为你精选了 5 本兼具深度与实用性的 AI 工程书籍,覆盖从底层原理到云端部署的完整知识链。无论你是刚入门的新手,还是希望进阶的工程师,这些书都值得一读。
检索增强生成技术的发展,正在重构大语言模型与外部知识的交互方式,为 AI 应用的落地提供了更可靠、更灵活的技术路径。2025 年多模态融合、动态知识管理等核心突破,进一步拓宽了 RAG 的应用边界,使其从文本领域走向更复杂的真实场景。作为科研工作者,我们既要关注技术创新带来的性能提升,也要重视实际应用中的落地挑战。未来,随着算法优化、架构创新和行业实践的不断深入,RAG 技术必将在更多领域发挥核心
AI智能体(Agent)正迅速从前沿概念走向实际应用。要构建一个高效、可靠的智能体,离不开一系列核心技术的支撑。本文将对当前主流的8大核心技术进行解析,帮助大家全面理解其工作原理与应用价值。
在当今的人工智能时代,NLP技术已经深入渗透到我们日常生活的各个方面,从智能助手、语音识别到机器翻译和文本生成,NLP正在以令人瞩目的速度改变着我们的生活方式。
Function的调用时Agent实现很重要的一步,只有了解了这个原理才可以更好的创建Agent。
本文是台大教授李宏毅讲授AI Agent的爆火油管视频的文字稿。内容层层递进,是学习和理解AI Agent难得的好教材。
这是一个集成了几十种 LLM 应用场景的超全 demo 集,覆盖了几乎所有你能想到的 AI agent 使用场景。
Dify 是一个开源的大语言模型(LLM)应用开发平台,融合了后端即服务(Backend as a Service, BaaS)和 LLMOps 的理念,旨在帮助开发者快速构建和部署生成式 AI 应用。
Awesome LLM Apps 开源项目给出了一个极具参考价值的答案——它是一个精心策划的LLM应用集合,涵盖AI代理(AI Agents)、检索增强生成(RAG)和多模型集成,为开发者提供了从理论到实践的完整路径。
AI Engineering》这本书以其全面性、时效性、实用性和可读性,成为了AI/LLM时代每个从业者和爱好者的必读书籍
今天给大家推荐这个大模型入门学习项目,实在是太香了太香了,目前该项目已经超过3000星,具体的文章分类如下所示。
这波AI浪潮,很多新词把人都绕晕了,如AI Agent(人工智能代理)、RAG(检索增强生成)、向量知识库、提示词工程、数据提取和解析、自然语言处理(NLP)、知识图谱以及图处理等。本文试图深入探讨这些概念,让大家一下子就能分辨。
开箱即用:封装了完整的微调流程,无需手动实现训练循环自动生成训练数据:使用LLM自动生成问答对,大大降低数据准备成本灵活的模型支持:支持多种Embedding模型(BGE、OpenAI等)完善的评估工具:内置评估函数,方便对比不同模型效果通过本文的实战教程,我们完成了:✅ 从PDF文档自动生成训练数据✅ 使用LlamaIndex微调BGE模型✅ 评估并对比微调前后的效果无需人工标注,LLM自动生成
本文提出构建多模态运维Agent的创新思路,将可视化监控数据(时序图、拓扑图、抓包图)与日志文本结合,利用多模态大模型实现智能故障诊断。文章详细设计了系统架构,包含截图采集、上下文构建和多模态分析三大模块,并规范了输入输出接口。重点阐述了从Grafana等监控系统获取图表截图的技术方案,以及如何组织"图表+日志"的上下文信息。通过结构化Prompt设计,使Agent能输出包含异
今天,让我们深入剖析RAG技术的方方面面,从基础概念到高级优化,从理论原理到实战案例,帮你构建真正可用的企业级AI知识系统。
为了让大家全方位吃透AI Agent,还能积极投身到生态建设里,好多公司都纷纷甩出了官方智能体解读和白皮书。
本文介绍ICLR 2025论文《SePer》,提出用语义困惑度(SePer)评估检索增强生成(RAG)中检索对答案的实际效用。该方法通过对比检索前后语义簇分布的不确定性变化,比传统相关性指标更准确反映检索对答案生成的实质性帮助。实验显示SePer与检索效用的相关性(平均0.778)显著优于ROUGE-L/NDCG等基线,且采样10次即可稳定。研究发现无关检索会对大模型产生显著负面影响,SePer可
RAG
——RAG
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net