logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

调参侠必备!从0到1手把手教你构建大模型RAG召回系统,小白也能秒变AI魔法师!

本文详解RAG系统中的数据召回流程,包含查询优化、混合检索、结果后处理、对话记忆管理和上下文管理五大核心模块。通过多阶段处理确保召回准确性,采用向量相似度与标量过滤结合策略,并实现智能重排序和上下文压缩。系统具备灵活参数调优能力,可应对低置信度召回、记忆冲突等异常场景,为多轮对话提供连贯、精准的知识支持。

文章图片
#人工智能#算法#sql +1
RAG死板不灵活?Agent思维模式才是大模型的未来!小白也能看懂

文章分析了RAG系统在多轮对话中的语义理解局限,指出其"先检索再增强"的固定流程导致上下文关联性问题。虽然通过记忆功能和问题改写可部分改善,但仍无法完全解决独立对话与语义模糊场景的挑战。相比之下,Agent更符合人类思维模式,能自主判断是否需要数据召回,避免了RAG的机械性,展现出更大的灵活性和适应性。

文章图片
#人工智能#算法#xss +1
爆肝总结!大模型上下文窗口限制全攻略,3招让你的AI永不‘失忆‘!

上下文工程是解决大模型上下文窗口限制的关键技术。模型上下文窗口有固定大小限制(以token计),包含输入和输出,多轮对话时易超限导致模型"失忆"。上下文工程需处理历史记录压缩、提示词结构设计和参考文档处理等问题,目的是在有限上下文内让模型表现更好,输出高质量回答。

文章图片
#人工智能#算法#sql +1
从入门到放弃?RAG系统召回率翻倍秘籍,小白也能秒变大模型专家!

文章揭示RAG系统核心在于知识库质量而非大模型本身。召回率低主因是知识覆盖不足、内容理解偏差和结构策略粗糙。提升方法包括:汇聚多渠道内容、建立数据更新机制、采用语义分块策略、添加元数据构建结构化向量库。强调高质量知识库是RAG系统成功的根本,需精细处理而非简单文档切割和嵌入。

文章图片
#人工智能#重构#软件工程 +1
大模型RAG系统召回数据“失踪“之谜?多库召回问题解决方案,代码直接抄!

本文分析了RAG系统中多库召回导致的相关数据丢失问题,探讨了文档处理质量和逻辑隔离不完善的原因,提出通过两阶段召回策略解决:先高阈值召回最相关数据,再在相关数据所在库中二次召回,提高召回准确率,避免无关数据干扰。

文章图片
#算法#人工智能#机器人 +3
RAG系统增强生成环节90%的人都做错了!小白程序员必看的3个优化技巧,让你的大模型效果翻倍!

本文聚焦RAG系统常被忽视的"增强生成"环节,揭示提示词窗口限制、历史记录占用空间及未格式化文档三大痛点。提出三大优化策略:确保文档高度相关并控制数量、压缩历史记录长度、对文档进行结构化处理。强调增强生成虽简单但需针对不同场景和模型特性持续测试优化,才能真正提升大模型生成质量。

文章图片
#react.js#人工智能#前端 +1
震惊!传统RAG vs 多模态RAG vs Agent,小白程序员必看:别再搞混这三个不同维度的AI技术了!

传统RAG和多模态RAG以及Agent是不同维度上的东西,并不能混为一谈。自大模型开始大规模应用以来,RAG技术就是其中一个重点应用方向,虽然一直有人说RAG只是一种过渡手段,但不管怎么说RAG是目前很重要的一个应用技术,而且适用于多种领域,如客服,咨询,检索等。但是,随着技术的发展RAG技术也经过了几轮迭代,包括RAG,Graph RAG和Agentic RAG等;而随着多模态技术的发展,多模态

文章图片
#人工智能#算法#sql +1
RAG多轮对话“翻车“?小白程序员必看:如何用问题改写解决上下文丢失痛点,让AI回答“句句在理“!

文章探讨了RAG多轮对话中因上下文缺失导致的文档召回不准确问题。提出解决方案是对用户查询进行改写,特别是基于历史对话上下文进行优化,以提升检索准确性。但同时也指出,当用户话题完全转换时,使用历史上下文可能导致误召回,需要在上下文保持与相关性之间找到平衡点,实现RAG系统在多轮对话中的最优表现。

文章图片
#人工智能#重构#软件工程 +1
【AI开发】别再只学框架了!大模型智能体开发,掌握这三要素才是关键!

智能体本质是大模型的函数调用能力,框架只是封装。Langgraph核心是State(状态)、Nodes(节点)和Edges(边):节点完成工作,边决定流程,State传递参数。框架支持顺序和并行执行,StateGraph保存中间结果,支持智能体中断恢复。开发智能体应先理解机制,再学框架使用。

文章图片
#人工智能#重构#软件工程 +1
Deep Agents凭什么能处理7个月长任务?LangChain核心方案全拆解!

在 AI 智能体(Agents)领域,一个显著的趋势正在加速演进 —— 智能体处理的任务周期越来越长,据相关数据显示,任务长度每 7 个月就会翻一番!这一趋势虽拓展了智能体的应用边界,但也带来了新的挑战:长周期任务往往需要数十次工具调用,成本飙升与可靠性下降的问题愈发凸显。 作为始终致力于降低智能体开发门槛的技术团队,LangChain AI 针对这一行业痛点,推出了专为复杂长周期任务设计的开源智

#机器学习#人工智能#安全 +2
    共 1352 条
  • 1
  • 2
  • 3
  • 136
  • 请选择