易迟个人主页

@hustyichi

易迟

2023-11-03 17:18:24 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

来自学术界的知识库 RAG 调优方案实践（一)

在之前的文章详细梳理过工业界的 RAG 方案QAnything和RagFlow，这次主要整理下来自学术界的一系列 RAG 优化方案。主要关注优化方案对应的设计思想以及相关的实现，希望可以对大家的 RAG 服务效果提升有所帮助。在综述论文Native RAG: 原始 RAG 架构，对应最原始的 RAG 流程，和之前搭建离线私有大模型知识库介绍的流程基本一致；Advanced RAG：高级 RAG 架

#人工智能 #python

向量数据库 Faiss 的实践与增强探索

在构建大模型知识库，即检索增强生成 (RAG) 服务时，中间存在一个核心环节就是向量化搜索，如果不希望引入第三方的向量数据库，那么开源的 Faiss 就是一个不错的选择。Faiss 是 FaceBook 提供的开源向量库搜索库，在Github上已经有 28.1k star，相对成熟而且使用方便。之前构建的 RAG 服务使用的就是 Faiss 提供的向量化搜索服务，Faiss 功能强大，上手简单。但

#faiss #人工智能 #python

从《红楼梦》的视角看大模型知识库 RAG 服务的 Rerank 调优

在之前的文章有道 QAnything 源码解读中介绍了有道 RAG 的一个主要亮点在于对 Rerank 机制的重视。从目前来看，Rerank 确实逐渐成为 RAG 的一个重要模块，在这篇文章中就希望能讲清楚为什么 RAG 服务需要 Rerank 机制，以及如何选择最合适的 Rerank 模型。最终以完整的《红楼梦》知识库进行实践。至于为什么要用红楼梦，答案就是作为读了很多遍《红楼梦》的忠实粉丝，问

#人工智能 #python

来自工业界的大模型知识库 RAG 服务，有道 QAnything 源码全流程深度解析

之前在做大模型知识库 RAG 优化时，主要参考的都是学术界的论文。最近了解到有道 QAnything 开源了，在线试用之后，效果看起来还不错，燃起了探索其实现细节的兴趣。正好对于 RAG 各个环节的最佳实践存在一些疑问，因此深入查看了有道 QAnything 的完整实现流程，学习下来自工业界大厂有道的实践方案，在这边分享给大家。本文章基于的是 2024-5 月最新的版本v1.4.0，这个项目还在持

#python #人工智能

求职季，用大模型给 HR 减减负

最近因为岗位扩张，经历了密集的简历轰炸。在短短一周内抽空筛查了接近 100+ 的前后端的简历筛选，和 HR 沟通之后，她反馈她那边已经做过一轮简历筛选，过滤掉接近 90% 的简历了，预期 HR 在短期内需要处理 1000+ 的简历筛选。考虑到这个工作的重复性，而且简历内容的筛查还存在一些明显的技术门槛，没有相关的技术背景容易误判，似乎有自动化的必要性。我们当前有一台测试服务器，上面部署了一套Dif

#人工智能

来自工业界的大模型知识库 RAG 服务，有道 QAnything 源码全流程深度解析

#python #人工智能

为什么大模型 Agent 产品总是无法落地？来自实战派的经验分享（二）

在之前的文章Agent 落地经验分享（一）中，介绍了 Agent 落地中存在的问题，并给出了一些初步的解决方案。在这篇文章中，针对 Agent 落地中的关键问题，给出更进一步的实战经验，希望对大家的 Agent 产品落地有所帮助。本文主要参考自。本文梳理了来自 humanlayer 的 12 条 Agent 构建经验。对我而言，最重要的启发是保持对 Agent 的“可控性”：避免将任务完全委派给大

#人工智能

为什么大模型 Agent 产品总是无法落地？来自实战派的经验分享（一）

自 2024 年底以来，行业不断有人喊出"2025 年 Agent 元年"的口号，不少大模型公司也开始调整战略方向，纷纷布局 Agent 领域。然而，大半年过去了，Agent 仅在有限领域实现了落地，在更多严肃的应用场景下，Agent 产品的落地效果并不理想。在新项目中持续进行 Agent 相关产品的开发落地，在探索过程中发现了 Agent 落地的一些关键障碍。结合最近解决问题时整理的资料以及个人

#人工智能

RAG 远远不够，外部数据增强的多维策略探索

随着大模型技术的发展，RAG(检索增强生成)已成为提升AI应用能力的标配方案。在过去两年中，我从最初的 langchain Demo 实践，到QAnything和RagFlow等项目的探索，见证了检索技术从简单的向量检索发展到知识图谱和 Agentic RAG 的过程。然而随着实践深入，RAG 方案的局限性逐渐显现。在处理复杂的现实场景时，简单的检索增强往往力不从心。如何更好地利用外部数据成为了一

#RAG

来自工业界的大模型知识库 RAG 服务，有道 QAnything 源码全流程深度解析

#python #人工智能

共 13 条

请选择