logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型-提示工程

本文系统介绍了大语言模型(LLM)的类型与使用方法,重点对比了基础大模型(基于概率预测)和指令微调模型(通过RLHF优化)的差异。详细阐述了ChatGPT提问的两大核心原则:1)编写清晰具体的指令(使用分隔符、结构化输出等技巧);2)给予模型思考时间(分步推理等)。同时介绍了温度参数、角色权重等接口设置,并提供了总结、推断等5种典型应用场景。

文章图片
大模型-提示工程

本文系统介绍了大语言模型(LLM)的类型与使用方法,重点对比了基础大模型(基于概率预测)和指令微调模型(通过RLHF优化)的差异。详细阐述了ChatGPT提问的两大核心原则:1)编写清晰具体的指令(使用分隔符、结构化输出等技巧);2)给予模型思考时间(分步推理等)。同时介绍了温度参数、角色权重等接口设置,并提供了总结、推断等5种典型应用场景。

文章图片
图神经网络(篇三)-基础知识

《深入浅出图神经网络-GNN原理解析》配套代码资源汇总,包含GCN、GraphSage、图分类和图自编码器等实战章节的PyTorch实现。书籍涵盖图神经网络基础理论、GCN性质、GNN变体与应用等内容,并引用多篇前沿论文。作者为互联网大厂算法专家,提供算法面试辅导与专业知识指导。配套代码链接详见文中,欢迎读者点赞收藏评论互动,共同探讨GNN技术。

文章图片
#神经网络#深度学习#人工智能
大模型-智能体-【篇二:多智能体框架】

本文综述了近年来7种多智能体协作框架:AutoGen(2023)支持自然语言交互和多工具组合;MetaGPT(2023)采用标准化操作提示优化工作流;AGENTS(2023)提供模块化开源库;OpenAgents(2023)构建Web交互平台;ChatDev(2023)实现虚拟公司式软件开发;CAMEL(2023)运用角色扮演生成对话数据;AgentSims(2023)创建沙盒测试环境。最新提出的

文章图片
大模型-智能体-【篇六: Autogen Studio、CrewAI vs AutoGen】

本文对比分析了两个智能体框架:Microsoft的AutogenStudio和CrewAI。AutogenStudio是建立在AutoGen框架上的UI应用(2024.01发布),提供详细安装教程但尚未成熟。CrewAI更适合熟悉LangChain的开发者,学习曲线较AutoGen平缓。

文章图片
大模型-智能体-【篇五: Autogen、CrewAI、Autogen MultiAgent】

本文介绍了三种智能体框架:Autogen(微软2023.03发布,支持多智能体协同)、CrewAI(2023.11推出,作为Autogen替代方案)和AutogenMultiAgent(通过API集成扩展功能)。重点展示了各框架的项目链接、发布时间和核心功能,包括Autogen的多智能体协同、CrewAI的具体实现示例,以及AutogenMultiAgent通过API实现的群聊、应用开发和旅游代理

文章图片
大模型-智能体-【篇四: Agent GPT 、AgentTuning、LangChain-Agent】

本文介绍了三种智能体框架:AgentGPT、AgentTuning和LangChain-Agent。AgentGPT(2023.04)是一个浏览器运行的Agent项目,支持GPT-4模型调用;AgentTuning(2023.10)是清华大学与智谱AI提出的方法,通过构建AgentInstruction数据集和混合指令微调提升LLM的Agent能力;LangChain-Agent则提供了多种代理类

文章图片
大模型-智能体-【篇三: AutoGPT 、BabyAGI 、HuggingGPT】

本文介绍了三种主流智能体框架:1)AutoGPT(基于GPT-4/3.5的任务自动化工具);2)BabyAGI(支持多模型的任务管理系统);3)HuggingGPT(自动调用Huggingface模型的AI调度系统)。分别从发布时间、项目链接、核心功能和使用方法进行说明,其中AutoGPT近期移除了向量数据库支持,BabyAGI支持任务优先级管理,HuggingGPT能自动分析需求并调用合适模型。

文章图片
大模型-训练-【篇五:后训练-强化学习】

本文介绍了强化学习(RL)的演进路径,重点对比了不同奖励机制:RLHF(人类反馈)、RLAIF(AI反馈)、RLVR(可验证奖励),以及过程监督和评分标准奖励。RLVR在数学推理和代码能力方面表现突出。文章还比较了PPO、GRPO等RL算法特性。

文章图片
大模型-训练-【篇四:后训练-基础了解&SFT】

随着预训练边际效益递减,后训练技术(SFT和强化学习)成为提升模型性能的关键,重点在于数据质量优化。SFT阶段需处理标签噪声、分布不匹配等问题,通过过滤/验证/数据增强建立高质量pipeline。训练时采用动态批处理等技术提升效率,使用改进的交叉熵损失函数避免数值问题。后训练核心是对齐模型行为(如诚实性)并强化预训练能力。

文章图片
#机器学习#深度学习
    共 46 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择