logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

标准 Agent 开发 SOP(从 0 到 1)

不是所有问题都适合 Agent。如果任务流程固定、步骤清晰、分支很少,那么通常 workflow 就够了;只有当任务存在不确定性、需要动态选择工具、需要基于中间结果继续决策时,Agent 才真正有价值。Anthropic 明确区分了 workflow 与 agent:前者是预定义路径,后者是模型动态决定执行过程;OpenAI 也把 agent 定义为能代表用户独立完成一段工作流的系统。openai

#人工智能
Prompt Engineering技术路线梳理

最早,它是在研究怎么把任务说清楚;后来,它开始研究怎么让模型一步一步想清楚;再后来,它开始研究怎么让模型借助工具、验证和反思做清楚;到今天,它越来越像是在研究怎样把整条上下文与任务流程设计清楚。一门围绕语言模型输入、推理和控制方式不断演化的方法学。

#人工智能#深度学习#机器学习
论文解读 —— Contrastive Preference Optimization

作者是NLP小白,因为推免期间有些课题组需要所以尝试着去了解这个新领域,有解读不对的地方请多多谅解~

#自然语言处理#nlp#语言模型 +2
手把手教你复现/微调ALMA

作者:Haoran Xu, Jiayi Wang, Xinyi Wang, Kevin Yang, Yuqing Tang, Ankur Bapna, Orhan Firat发布于 arXiv:2404.12135 [cs.CL], 2024年4月原仓库:由于本地设备资源有限,我未从头开始训练模型,而是采用了作者开源的预训练模型 ALMA-7B-Pretrain以及其对应的适配器 ALMA-7B-

#自然语言处理#nlp#语言模型 +2
手把手教你复现/微调ALMA

作者:Haoran Xu, Jiayi Wang, Xinyi Wang, Kevin Yang, Yuqing Tang, Ankur Bapna, Orhan Firat发布于 arXiv:2404.12135 [cs.CL], 2024年4月原仓库:由于本地设备资源有限,我未从头开始训练模型,而是采用了作者开源的预训练模型 ALMA-7B-Pretrain以及其对应的适配器 ALMA-7B-

#自然语言处理#nlp#语言模型 +2
到底了