
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Agent Skills的核心底座确实就是一个存放prompt的md文件,里面的name/description相当于这份文件的唯一标识,LLM通过判别用户输入和description的匹配度,实现skill文件定位和调用。在此之上,我们还可以添加各类附属脚本和资源文件,让它能调用脚本,变成更加复杂的可执行的自动化工具

小白一句话RAG就是给大模型外挂一个知识库。大模型的三大硬伤幻觉:爱编故事,有些东西他明明不知道,却能编得像真的一样知识截止:模型在训练完成后参数锁定,每次重新训练都要消耗数周甚至数月的时间,该期间产生的新知识新事件无法获得无法访问私有数据:世界上存在大量私有数据:你们公司的内部文档、产品手册,你家的家规族谱,他从来没看过核心思想:把大模型从"闭卷考试"变成"开卷考试",通过引入外部数据来解决这些

团队里的人各自写工具,有人用 REST,有人用 gRPC,有人直接读本地文件。识别部分写好了,但在最后集成的时,发现接口格式五花八门,有的小伙伴是用的json返回的,有的是xml,怎么办?返回:{"content": [{"type": "text", "text": "{\"temp\": 25, \"condition\": \"晴\"}"}]}⚠️好不容易把这套代码上线了,这时候有个新工具需

Agent Skills的核心底座确实就是一个存放prompt的md文件,里面的name/description相当于这份文件的唯一标识,LLM通过判别用户输入和description的匹配度,实现skill文件定位和调用。在此之上,我们还可以添加各类附属脚本和资源文件,让它能调用脚本,变成更加复杂的可执行的自动化工具

LLM之所以厉害,不仅仅在于他的聊天技能,更在于将他与传统IT工具结合后形成的Agent,可以帮我们解决很多实际问题、实现业务价值

对话是大语言模型有且唯一的输入x,在F训练完成无法改变的情况下, 输入x的质量直接决定了输出y的质量

而对于绝大多数的中小型企业和数字个体,我们能做的,也是主要发力点,就是学会利用各类增强技术去赋能大模型这个强力底座,实现业务应用,创造业务价值。

模型的本质其实就是一个“数学公式”: y=F(x),数据通过某种算法训练得到的公式就是模型。

顾名思义,是对大语言模型进行细微调整以使其符合特定场景的应用。大模型虽然很强大,但是它在实时性/灵活性/特定领域专业性上还是有所欠缺,一旦训练完成不可更改。他就像是个万金油,啥都会一点,但是啥都不精通。普通大众或是一些小微企业为了满足特定场景需求,是无法承担训练这样一个模型的巨大成本的。大模型微调,就像给原本的llm叠了一个小buff,使其拥有特定技能,也让我们能以极低的成本解决问题。当然是调参数







