logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【RAG-十 一-检索增强技术之迭代增强】

迭代增强(Iterative RAG)是一种将 RAG 过程重复执行多次的方法。检索(Retrieve):基于当前问题或子问题从知识库中检索相关信息;增强(Augment):将检索结果与已有上下文融合;生成(Generate):生成中间答案,并从中提取新线索(如关键词、子问题等);反馈(Feedback):将新线索用于下一轮检索,形成闭环迭代。多跳问答(Multi-hop QA)复杂推理任务需要多

#人工智能
【RAG-六-检索增强技术之查询改写】

D, I = index.search(embedding, k=2) # 检索最相关的两个文档print(f"-

文章图片
#人工智能
【RAG-八-检索增强技术之多索引检索】

首先将原始文档分割成多个大块;然后每个大块进一步被拆分为更小的片段用于精确匹配用户查询;在检索时,使用这些小片段进行匹配,但最终返回的是包含最佳匹配小片段的大块文档给模型处理。这种方法能够在保证检索精度的同时,确保提供给模型足够的上下文信息,以生成更加准确的回答。在构建知识库时,预先为每篇文档生成一个简短的摘要;在检索阶段,首先根据用户的查询匹配摘要;如果摘要匹配成功,则返回对应的原始长文档内容。

文章图片
#人工智能
【RAG-五-检索增强技术之子问题查询-问题拆解】

print(f"-d } ")d } ")- 《太空日记》——杨利伟写给青少年的航天故事- 《时间简史》是一本关于宇宙起源和发展的经典科普书- 《十万个为什么》第六版涵盖物理、化学、生物等多个领域。

文章图片
#人工智能
【RAG-三-检索前增强技术之 query2doc】

查询增强是指在不改变用户意图的前提下,对原始查询进行扩展、重写或改写,以生成更准确、更具代表性的搜索请求,从而提高检索系统的召回率和准确率。(Q2D)是一种新兴的查询增强策略,其核心思想是通过一个深度学习模型,将用户的原始查询(query)转换为一个伪文档(pseudo-document),该伪文档包含了与原始查询高度相关的语义信息,并可作为增强后的“查询表示”用于后续检索。提高召回率和准确率解决

#人工智能
【Lightrag 框架介绍与代码实战】

lightrag/├── lightrag/ # 核心代码模块│ ├── api/ # 核心逻辑:api│ ├── webui/ # 编译后的前端模块│ ├── llm/ # 语言模块引擎模块│ ├── server/ # Web 服务端代码(FastAPI + Vue 前端)│ └── utils/ # 工具类函数:如日志、缓存、token 处理等├── examples/ # 示例脚本。

#知识图谱#人工智能
【RAG-九-增强检索技术之融合检索BM25+Embeding】

融合检索是一种将多种检索方法的结果进行加权整合的策略。语义向量检索(Dense Retrieval):如使用 FAISS 或 ANN 实现的基于 Embedding 的近似最近邻搜索;关键词检索(Sparse Retrieval):如 BM25 等传统信息检索算法。语义检索能捕捉深层语义关系;BM25 能有效利用关键词频率等结构化信息。通过融合排序(Re-ranking),可以综合两者的优势,提高

#人工智能
【RAG-四-检索前增强技术之HyDE假设文档增强】

是一种基于大语言模型(LLM)的查询增强方法。其核心思想是:给定一个用户查询,使用语言模型生成一段描述性的假设文档,然后将该文档编码为稠密向量,代替原始查询进行检索。

#oracle#数据库
    共 38 条
  • 1
  • 2
  • 3
  • 4
  • 请选择