
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
其实经过Cursor的使用,我感觉系统的开发方式其实已经发生了系统性的改变,过去可能需要人来设计系统和纯手敲代码,但是今天的工作方式更多的应该是给ai写提示词,指挥ai工作,这可能才是未来工程师的工作,工程师与ai构成一个人机协同系统,完成项目的开发。接着Cursor遍开始按照前面制定的计划开始修改项目,每一个改动都可以在对话中被观测到,其实给我的最大感觉,这个Cursor和装了AI assist
但是千辛万苦搞到的账号,我担心接入claude code,不一定什么时候会被识别地址,这样会导致又被封号,所以我没敢在Claude code上使用claude,刚好deepseek升级了,推出了v4版本,这个版本对claude 提供支撑,索性我下载了cc switch,切换了claude code的脑子。但是功能都一样,可以用来测一测现在这个系统的情况。从记录情况来看,我个人感觉,随着ai工具的发
总体来看,通过这次升级我感觉 FAISS 知识向量数据库更像是一种内存级的知识向量数据库,Milvus 像是更像是一种存在文件系统里面的数据库,可能用传统数据库打比方,FAISS 更像是 Redis ,Milvus像是Mysql。当前的 Paper-RAG-Agent-with-LangGraph 系统使用的 FAISS 知识向量数据库,但是和落地场景下的实际项目还有差距,这次升级主要目的是把这个
通过RAG技术可以在一定程度上消除大模型的幻觉,但是如果召回的知识不够充分,那么大模型的回答仍会存在一定幻觉,验证上下文是否充分是为了判断大模型回答的结果是否可信。context_sufficient 现在判断的是“检索结果是否相对接近”,但没有判断“这些结果是否真的回答了用户问的具体主题”。个距离最小的——它只能告诉你"这是索引里最接近的",不能告诉你"它真的回答了你的问题"。“假设用户问的是论
调整后的检索上下文比最早的版本文段更长,基于检索到的信息可以帮助用户回忆以往的研究内容,同时这样的内容让用户看到后能感觉心里放心,知道模型回答的结果是有依据的。但是这些信息还需要在Django中的页面中反馈给用户才可以,这样用户能清楚的知道系统是如果工作的,以及判断给出的问答结果是否可靠。经过调整后,页面有了更为完整的 Agent Trace 信息,这样用户可以判断智能体的工作是否可靠。需要修改的
相比继续堆叠新功能,今天更重要的是把已有功能打磨得更可靠、更容易解释。这些改动说明项目不只是把 RAG 和 Agent 跑通,而是在逐步补齐真实 AI 应用工程中会遇到的问题。改成了更安全的表达式处理方式,只支持有限范围内的基础计算,并对非法输入返回明确错误信息。因此今天对上传后的反馈进行了补充,使页面能够展示 reload 是否成功,以及。第二,调试时不容易判断问题出在上传环节、知识库重建环节,
前面已经完成从Django上传论文的PDF并且重建知识向量数据库 ,但是这个功能仍存问题,因为在FastAPI中,重建工作是重新赋值了全局变量rag,而没有重建workflow,我的工作流在工具选择节点和工具执行节点是用到工厂函数创建的,这个节点中是有rag变量作为依赖的,所以如果我重建了rag,但是没有更新workflow,那么实现的工作流在后续问答环节可能无法回复与新上传论文相关的问题,所以这
前面已经将FastAPI封装的AI能力接入Django形成了一个比较基本的用户UI界面,但是这个用户界面就好像毛坯房,所以这篇博客的主要工作是对“毛坯房”进行简装,过程中将会优化页面的UI增加会话列表增加文档上传和数据库重建功能以及增加系统的可解释性。
咱们后面的功能将会迈进智能体,在这之前我感觉有必要对以前写的代码进行分层重构,这样当后面项目越来越大的时候,咱们维护代码的时候会很清晰。
这种方式其实有一点不好,就是智能体判断完可能是什么任务后直接就开始执行,得到结果就给了用户,这种方式得到的结果质量可能一般,所以为了提升智能体执行任务返回结果的质量,姚顺雨在2020年提出的了这种AI范式,其核心在于让大语言模型通过“推理-行动-观察”的循环与外部环境交互,以完成复杂任务。咱们需要修改咱们前面写的。







