鹿枝儿个人主页

@weixin_43681781

鹿枝儿

2023-08-18 13:43:52 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

给Agent输出加合规过滤怎么做

DFA 只认字面词，认不出"你们老板是不是跑路了"这种没有敏感词、但语义有风险的句子。这层我没自己训模型，直接挂了个现成大模型当二次裁判：把过滤后的回答连同一句"判断这段话是否涉及法律/政治/对公司的负面指控，只回 safe 或 risk"丢给它，返回 risk 就走兜底话术。这套二次复核我是搭在一个零代码就能配智能体的平台上做的——拖个节点、挂上知识库、把上面这套过滤逻辑接成一个处理环节，不用我

#人工智能

给下单Agent做幂等防重复提交

让 AI 智能体去下单这事，听着很酷，真上线第一个把我吓出冷汗的就是——它给同一个用户连下了三单。

#人工智能

接了个外包，靠场景模板两小时交了客服智能体

先说结果：周五下午接的活，要一个电商客服智能体，对方催得急。我从动工到demo能跑，统共俩小时。这事搁两年前想都不敢想，那会儿光环境就得配半天。记录一下这两小时干了啥。

#人工智能

客服分不清用户问的是退款还是退货，意图分类怎么救

结果上线第二天就翻车——有个用户打字"退订一下短信营销"，被我那套关键词稳稳判成了"退货申请"，机器人热情地问他要快递单号，人都麻了。"我要退款，顺便问下还没发货为啥扣了我钱"——这句里头退款和物流查询都沾。我的土办法是允许它返回主+次两个标签，主标签走流程，次标签塞进回复末尾补一句"另外您问的扣费问题…意图分类这事，少即是多。前端出身能独立搭完，主要靠那种拖一拖就能配好分类和分支的工具，省了我求

#人工智能

能用if-else的别交给大模型:规则引擎和Agent该怎么配合

又慢、又贵、还不稳定。这篇不讲具体代码多,主要是个架构观点,讲规则引擎和 Agent 怎么各干各的、怎么配合。

#人工智能

RAG 分块多大合适？固定长度 vs 按标题 vs 语义分块，我拿同一份文档实测了一组数据

不是选一个用到死，是按文档类型分有清晰标题层级的（手册、Wiki）→ 按标题分块。几乎不更新、要求高召回的（API 文档、法规）→ 语义分块。实在没结构的纯文本 → 固定 512 + 50 重叠，将就。还有个没测进去的变量是表格。表格被任何按字数的策略切都会烂，我后来是把大表格单独拎出来转成"每行一条问答"再入库的，这个另说。底层模型和向量化我用的是讯飞MaaS 提供的现成接口，模型即服务，没自己

#人工智能

蛙蛙写作市场竞争分析：定位网文创作细分赛道，构建差异化壁垒

蛙蛙写作凭借对网文创作场景的深度聚焦、依托美团生态的独特优势，以及持续迭代的产品能力，有望在这一细分赛道持续扩大领先优势。与通用AI写作工具相比，蛙蛙写作的所有功能设计均围绕网文创作的特殊需求展开：长篇连载内容的一致性管理、网文题材类型的特定模板、创作节奏和读者留存等网文行业特有的创作方法论。在这片竞争激烈的市场中，蛙蛙写作选择了网络文学创作这一高度垂直的细分赛道，通过对目标用户需求的深度理解和产

关于做 RAG 知识库，被新人问最多的 8 个问题，我一次答完

RAG 的瓶颈九成在召回，不在模型。文档没切好、向量不对路，再强的模型也是"巧妇难为无米之炊"。召回 Top10 后用重排取前 3，能救回"召回到了但排太后被截断"的情况，准确率有提升，值得加。带人做知识库问答 Agent，同样的问题被问了无数遍。整理成 Q&A，新人入门、老人查漏都能用。整篇一个 chunk，语义被稀释，检索匹配不上。，配知识库，切片、向量、重排都能在界面里调，不用自己搭检索链路

#数据库

别等月底账单吓一跳：给 Agent 做用量统计和配额，把成本攥在手里

大模型按量付费，最怕的是"用着用着不知道花了多少"，月底账单一出来心头一紧。尤其多个 Agent、多个调用方时，钱花在哪、谁花得多，一笔糊涂账。给 Agent 做用量统计和配额，是把成本攥在自己手里的前提。记一下我做的几件事。

#服务器 #数据库 #运维

别全程用最贵的模型：Agent 里按问题难度分流，我把成本砍了一多半

智能体跑起来后我对了下账单，发现个浪费：不管用户问的是"你好"还是一道复杂推理题，我都一股脑甩给最强的模型。简单问候也用顶配，钱哗哗地流。其实大部分请求根本用不着最强模型。按难度分流，能省一大笔。

#人工智能

共 11 条

请选择