logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

embedding加缓存,省一半向量调用

顺带提一句,这套问答小助手我没自己写多少胶水,是在一个零代码就能拖配智能体的平台上搭的,知识库 RAG、模型挂载它都包了,我主要就管这层 embedding 缓存的优化。模型名必须带上,因为 text-embedding-3-small 和换个模型出来的向量维度、数值都不一样,混在一个缓存里就是灾难——这个坑我是真栽过,换模型那天检索结果全乱,查了俩小时才定位到是缓存没隔离。没到夸张的九成,因为我

文章图片
#缓存
给智能体挂MCP Server加外部能力实操(联网查天气)

智能体只会聊天没用,得能动手干活。这篇记录我怎么给一个智能体挂上 MCP Server,让它能联网、能查实时天气、能调外部工具,全程零代码,照着步骤就能复现。先说 MCP 是啥,一句话:一套让大模型调用外部工具的标准协议。以前每接一个工具要写一遍适配代码,现在工具方按 MCP 暴露能力,智能体这边直接挂,不用写胶水代码。

文章图片
#java#前端#linux
给智能体挂MCP Server加外部能力实操(联网查天气)

智能体只会聊天没用,得能动手干活。这篇记录我怎么给一个智能体挂上 MCP Server,让它能联网、能查实时天气、能调外部工具,全程零代码,照着步骤就能复现。先说 MCP 是啥,一句话:一套让大模型调用外部工具的标准协议。以前每接一个工具要写一遍适配代码,现在工具方按 MCP 暴露能力,智能体这边直接挂,不用写胶水代码。

文章图片
#java#前端#linux
到底了