logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

[MAF预定义ChatClient中间件-03]CachingChatClient——利用缓存省钱省时间

时启用缓存,否则不启用缓存,它表达的含义是:如果采用无状态的调用方式,有输入决定输出的缓存策略是安全的;比如当我们使用OpenAI Responses API时,由于历史记录非常长,我们往往只把最新的一句话发过去,此时我们希望得到是针对整个对话历史的响应,而不是针对最新一句话的响应,所以启用缓存就会导致得到错误的结果。方法来获取LLM的响应,第一次调用会触发对LLM的调用,而第二次调用则会直接返回

#中间件#缓存
Agentic Skill Routing 实战:别再把所有 Skill 塞进 AI Agent 上下文

Skill。短期看很灵活,长期看就会把 Agent 的路由入口堆成一片噪声。我最近在想的不是“再训练一个更准的 Skill 分类器”,而是另一个问题:Skill 能不能像知识库一样被 Agent 主动检索?常用能力保持在手边,长尾能力先放进冷存储;需要时,Agent 自己搜索、检查证据、确认选择,再把对应 Skill 拉回来执行。这其实就是 ​​。

#人工智能#算法
Agentic Skill Routing 实战:别再把所有 Skill 塞进 AI Agent 上下文

Skill。短期看很灵活,长期看就会把 Agent 的路由入口堆成一片噪声。我最近在想的不是“再训练一个更准的 Skill 分类器”,而是另一个问题:Skill 能不能像知识库一样被 Agent 主动检索?常用能力保持在手边,长尾能力先放进冷存储;需要时,Agent 自己搜索、检查证据、确认选择,再把对应 Skill 拉回来执行。这其实就是 ​​。

#人工智能#算法
Agentic Skill Routing 实战:别再把所有 Skill 塞进 AI Agent 上下文

Skill。短期看很灵活,长期看就会把 Agent 的路由入口堆成一片噪声。我最近在想的不是“再训练一个更准的 Skill 分类器”,而是另一个问题:Skill 能不能像知识库一样被 Agent 主动检索?常用能力保持在手边,长尾能力先放进冷存储;需要时,Agent 自己搜索、检查证据、确认选择,再把对应 Skill 拉回来执行。这其实就是 ​​。

#人工智能#算法
Agentic Skill Routing 实战:别再把所有 Skill 塞进 AI Agent 上下文

Skill。短期看很灵活,长期看就会把 Agent 的路由入口堆成一片噪声。我最近在想的不是“再训练一个更准的 Skill 分类器”,而是另一个问题:Skill 能不能像知识库一样被 Agent 主动检索?常用能力保持在手边,长尾能力先放进冷存储;需要时,Agent 自己搜索、检查证据、确认选择,再把对应 Skill 拉回来执行。这其实就是 ​​。

#人工智能#算法
Agentic Skill Routing 实战:别再把所有 Skill 塞进 AI Agent 上下文

Skill。短期看很灵活,长期看就会把 Agent 的路由入口堆成一片噪声。我最近在想的不是“再训练一个更准的 Skill 分类器”,而是另一个问题:Skill 能不能像知识库一样被 Agent 主动检索?常用能力保持在手边,长尾能力先放进冷存储;需要时,Agent 自己搜索、检查证据、确认选择,再把对应 Skill 拉回来执行。这其实就是 ​​。

#人工智能#算法
到底了