还559 个人主页

@qq_74850051

还559

2023-08-15 14:01:08 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

标准 Agent 开发 SOP（从 0 到 1）

不是所有问题都适合 Agent。如果任务流程固定、步骤清晰、分支很少，那么通常 workflow 就够了；只有当任务存在不确定性、需要动态选择工具、需要基于中间结果继续决策时，Agent 才真正有价值。Anthropic 明确区分了 workflow 与 agent：前者是预定义路径，后者是模型动态决定执行过程；OpenAI 也把 agent 定义为能代表用户独立完成一段工作流的系统。openai

#人工智能

Prompt Engineering技术路线梳理

最早，它是在研究怎么把任务说清楚；后来，它开始研究怎么让模型一步一步想清楚；再后来，它开始研究怎么让模型借助工具、验证和反思做清楚；到今天，它越来越像是在研究怎样把整条上下文与任务流程设计清楚。一门围绕语言模型输入、推理和控制方式不断演化的方法学。

#人工智能 #深度学习 #机器学习

论文解读 —— Contrastive Preference Optimization

作者是NLP小白，因为推免期间有些课题组需要所以尝试着去了解这个新领域，有解读不对的地方请多多谅解~

#自然语言处理 #nlp #语言模型 +2

手把手教你复现/微调ALMA

作者：Haoran Xu, Jiayi Wang, Xinyi Wang, Kevin Yang, Yuqing Tang, Ankur Bapna, Orhan Firat发布于 arXiv:2404.12135 [cs.CL], 2024年4月原仓库：由于本地设备资源有限，我未从头开始训练模型，而是采用了作者开源的预训练模型 ALMA-7B-Pretrain以及其对应的适配器 ALMA-7B-

#自然语言处理 #nlp #语言模型 +2

手把手教你复现/微调ALMA

#自然语言处理 #nlp #语言模型 +2

到底了