logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

白话大模型增强技术系列之Agent Skills

Agent Skills的核心底座确实就是一个存放prompt的md文件,里面的name/description相当于这份文件的唯一标识,LLM通过判别用户输入和description的匹配度,实现skill文件定位和调用。在此之上,我们还可以添加各类附属脚本和资源文件,让它能调用脚本,变成更加复杂的可执行的自动化工具

文章图片
#人工智能
白话大模型增强技术系列之RAG

小白一句话RAG就是给大模型外挂一个知识库。大模型的三大硬伤幻觉:爱编故事,有些东西他明明不知道,却能编得像真的一样知识截止:模型在训练完成后参数锁定,每次重新训练都要消耗数周甚至数月的时间,该期间产生的新知识新事件无法获得无法访问私有数据:世界上存在大量私有数据:你们公司的内部文档、产品手册,你家的家规族谱,他从来没看过核心思想:把大模型从"闭卷考试"变成"开卷考试",通过引入外部数据来解决这些

文章图片
#数据库
白话大模型增强技术系列之MCP

团队里的人各自写工具,有人用 REST,有人用 gRPC,有人直接读本地文件。识别部分写好了,但在最后集成的时,发现接口格式五花八门,有的小伙伴是用的json返回的,有的是xml,怎么办?返回:{"content": [{"type": "text", "text": "{\"temp\": 25, \"condition\": \"晴\"}"}]}⚠️好不容易把这套代码上线了,这时候有个新工具需

文章图片
#人工智能
白话大模型增强技术系列之Agent Skills

Agent Skills的核心底座确实就是一个存放prompt的md文件,里面的name/description相当于这份文件的唯一标识,LLM通过判别用户输入和description的匹配度,实现skill文件定位和调用。在此之上,我们还可以添加各类附属脚本和资源文件,让它能调用脚本,变成更加复杂的可执行的自动化工具

文章图片
#人工智能
白话大模型增强技术系列之Agent

LLM之所以厉害,不仅仅在于他的聊天技能,更在于将他与传统IT工具结合后形成的Agent,可以帮我们解决很多实际问题、实现业务价值

文章图片
#人工智能
白话大模型增强技术系列之Prompt Engineering

对话是大语言模型有且唯一的输入x,在F训练完成无法改变的情况下, 输入x的质量直接决定了输出y的质量

文章图片
#人工智能
白话大模型增强技术系列之概览篇

而对于绝大多数的中小型企业和数字个体,我们能做的,也是主要发力点,就是学会利用各类增强技术去赋能大模型这个强力底座,实现业务应用,创造业务价值。

文章图片
#人工智能
白话大模型增强技术系列之LLM速通

模型的本质其实就是一个“数学公式”: y=F(x),数据通过某种算法训练得到的公式就是模型。

文章图片
#人工智能
一秒入门大模型微调

顾名思义,是对大语言模型进行细微调整以使其符合特定场景的应用。大模型虽然很强大,但是它在实时性/灵活性/特定领域专业性上还是有所欠缺,一旦训练完成不可更改。他就像是个万金油,啥都会一点,但是啥都不精通。普通大众或是一些小微企业为了满足特定场景需求,是无法承担训练这样一个模型的巨大成本的。大模型微调,就像给原本的llm叠了一个小buff,使其拥有特定技能,也让我们能以极低的成本解决问题。当然是调参数

#人工智能#深度学习
推荐系统浅学与实践

最近学习了一下推荐系统,把自己的所得分享出来。本人才疏学浅,如有不对的地方,还望指正~1.系统架构推荐系统的目的只有一个:把用户可能感兴趣的产品推荐给他们。推荐系统可以说是AI落地最成功的一个领域,它和我们的日常生活相关,我们每天刷短视频,新闻,逛pdd淘宝都会与他打交道。推荐系统是一个极具综合性的系统,涉及前端、后端、大数据、算法、机器学习等等技术,它没有固定的格式,针对不同的场景可以有灵活的搭

#推荐算法
到底了