
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
DFA 只认字面词,认不出"你们老板是不是跑路了"这种没有敏感词、但语义有风险的句子。这层我没自己训模型,直接挂了个现成大模型当二次裁判:把过滤后的回答连同一句"判断这段话是否涉及法律/政治/对公司的负面指控,只回 safe 或 risk"丢给它,返回 risk 就走兜底话术。这套二次复核我是搭在一个零代码就能配智能体的平台上做的——拖个节点、挂上知识库、把上面这套过滤逻辑接成一个处理环节,不用我

让 AI 智能体去下单这事,听着很酷,真上线第一个把我吓出冷汗的就是——它给同一个用户连下了三单。

先说结果:周五下午接的活,要一个电商客服智能体,对方催得急。我从动工到demo能跑,统共俩小时。这事搁两年前想都不敢想,那会儿光环境就得配半天。记录一下这两小时干了啥。

结果上线第二天就翻车——有个用户打字"退订一下短信营销",被我那套关键词稳稳判成了"退货申请",机器人热情地问他要快递单号,人都麻了。"我要退款,顺便问下还没发货为啥扣了我钱"——这句里头退款和物流查询都沾。我的土办法是允许它返回主+次两个标签,主标签走流程,次标签塞进回复末尾补一句"另外您问的扣费问题…意图分类这事,少即是多。前端出身能独立搭完,主要靠那种拖一拖就能配好分类和分支的工具,省了我求

又慢、又贵、还不稳定。这篇不讲具体代码多,主要是个架构观点,讲规则引擎和 Agent 怎么各干各的、怎么配合。

不是选一个用到死,是按文档类型分有清晰标题层级的(手册、Wiki)→ 按标题分块。几乎不更新、要求高召回的(API 文档、法规)→ 语义分块。实在没结构的纯文本 → 固定 512 + 50 重叠,将就。还有个没测进去的变量是表格。表格被任何按字数的策略切都会烂,我后来是把大表格单独拎出来转成"每行一条问答"再入库的,这个另说。底层模型和向量化我用的是讯飞MaaS 提供的现成接口,模型即服务,没自己

蛙蛙写作凭借对网文创作场景的深度聚焦、依托美团生态的独特优势,以及持续迭代的产品能力,有望在这一细分赛道持续扩大领先优势。与通用AI写作工具相比,蛙蛙写作的所有功能设计均围绕网文创作的特殊需求展开:长篇连载内容的一致性管理、网文题材类型的特定模板、创作节奏和读者留存等网文行业特有的创作方法论。在这片竞争激烈的市场中,蛙蛙写作选择了网络文学创作这一高度垂直的细分赛道,通过对目标用户需求的深度理解和产
RAG 的瓶颈九成在召回,不在模型。文档没切好、向量不对路,再强的模型也是"巧妇难为无米之炊"。召回 Top10 后用重排取前 3,能救回"召回到了但排太后被截断"的情况,准确率有提升,值得加。带人做知识库问答 Agent,同样的问题被问了无数遍。整理成 Q&A,新人入门、老人查漏都能用。整篇一个 chunk,语义被稀释,检索匹配不上。,配知识库,切片、向量、重排都能在界面里调,不用自己搭检索链路

大模型按量付费,最怕的是"用着用着不知道花了多少",月底账单一出来心头一紧。尤其多个 Agent、多个调用方时,钱花在哪、谁花得多,一笔糊涂账。给 Agent 做用量统计和配额,是把成本攥在自己手里的前提。记一下我做的几件事。

智能体跑起来后我对了下账单,发现个浪费:不管用户问的是"你好"还是一道复杂推理题,我都一股脑甩给最强的模型。简单问候也用顶配,钱哗哗地流。其实大部分请求根本用不着最强模型。按难度分流,能省一大笔。








