
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
先说结论:不用写一行代码,拖一拖配一配,我真的在一周里把一个能用的 AI 小助手搭起来了——省掉的主要是后端那堆胶水活,不顺手的地方在于它干的始终是杂活,真正难的判断还得我自己兜。上周三晚上十点多,我本来只是想找个借口拖延手头一个老需求。运营那边老让我帮忙从十几份周报里扒数据、对口径、再汇个总,纯体力,烦得很。我寻思能不能让 AI 干。以前我对"AI Agent"这词是有点抵触的。一提就是要装框架

先说结论:不用写一行代码,拖一拖配一配,我真的在一周里把一个能用的 AI 小助手搭起来了——省掉的主要是后端那堆胶水活,不顺手的地方在于它干的始终是杂活,真正难的判断还得我自己兜。上周三晚上十点多,我本来只是想找个借口拖延手头一个老需求。运营那边老让我帮忙从十几份周报里扒数据、对口径、再汇个总,纯体力,烦得很。我寻思能不能让 AI 干。以前我对"AI Agent"这词是有点抵触的。一提就是要装框架

先说结论:不用写一行代码,拖一拖配一配,我真的在一周里把一个能用的 AI 小助手搭起来了——省掉的主要是后端那堆胶水活,不顺手的地方在于它干的始终是杂活,真正难的判断还得我自己兜。上周三晚上十点多,我本来只是想找个借口拖延手头一个老需求。运营那边老让我帮忙从十几份周报里扒数据、对口径、再汇个总,纯体力,烦得很。我寻思能不能让 AI 干。以前我对"AI Agent"这词是有点抵触的。一提就是要装框架

先说结论:不用写一行代码,拖一拖配一配,我真的在一周里把一个能用的 AI 小助手搭起来了——省掉的主要是后端那堆胶水活,不顺手的地方在于它干的始终是杂活,真正难的判断还得我自己兜。上周三晚上十点多,我本来只是想找个借口拖延手头一个老需求。运营那边老让我帮忙从十几份周报里扒数据、对口径、再汇个总,纯体力,烦得很。我寻思能不能让 AI 干。以前我对"AI Agent"这词是有点抵触的。一提就是要装框架

先说结论:不用写一行代码,拖一拖配一配,我真的在一周里把一个能用的 AI 小助手搭起来了——省掉的主要是后端那堆胶水活,不顺手的地方在于它干的始终是杂活,真正难的判断还得我自己兜。上周三晚上十点多,我本来只是想找个借口拖延手头一个老需求。运营那边老让我帮忙从十几份周报里扒数据、对口径、再汇个总,纯体力,烦得很。我寻思能不能让 AI 干。以前我对"AI Agent"这词是有点抵触的。一提就是要装框架

重排这层做的事很简单:先用向量宽松地召回 20 个候选(召回阶段宁滥勿缺),再用一个专门的 reranker 模型,把"问题-候选段落"成对打分,按分数重新排,取前 5。整个召回+重排的链路,我是在一个零代码就能配 RAG 的平台上拖出来的,知识库分块、向量召回、重排节点都是现成模块连一下。比如用户问"导出失败怎么排查",向量召回经常把"导入失败"的段落也捞上来——俩词长得太像,embedding

我自己折腾了一阵,最后悟出来一句话——工具描述写得烂,模型就调得烂。下面是我把工具描述当成给同事看的 API 文档来打磨之后,踩坑率明显下降的几条经验。

做长对话的智能体,最先撞墙的就是上下文。聊到二三十轮,token蹭蹭涨,要么超模型窗口直接报错,要么账单看着肉疼。我折腾了大半个月,最后落到"滑动窗口+要点压缩"这套组合,实测token砍了快一半,关键信息基本没丢。记一下过程。








