小新学习屋个人主页

@2401_85747530

小新学习屋

2025-06-24 00:27:33 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

大模型-提示工程

本文系统介绍了大语言模型（LLM）的类型与使用方法，重点对比了基础大模型（基于概率预测）和指令微调模型（通过RLHF优化）的差异。详细阐述了ChatGPT提问的两大核心原则：1）编写清晰具体的指令（使用分隔符、结构化输出等技巧）；2）给予模型思考时间（分步推理等）。同时介绍了温度参数、角色权重等接口设置，并提供了总结、推断等5种典型应用场景。

大模型-提示工程

图神经网络（篇三）-基础知识

《深入浅出图神经网络-GNN原理解析》配套代码资源汇总，包含GCN、GraphSage、图分类和图自编码器等实战章节的PyTorch实现。书籍涵盖图神经网络基础理论、GCN性质、GNN变体与应用等内容，并引用多篇前沿论文。作者为互联网大厂算法专家，提供算法面试辅导与专业知识指导。配套代码链接详见文中，欢迎读者点赞收藏评论互动，共同探讨GNN技术。

#神经网络 #深度学习 #人工智能

大模型-智能体-【篇二：多智能体框架】

本文综述了近年来7种多智能体协作框架：AutoGen（2023）支持自然语言交互和多工具组合；MetaGPT（2023）采用标准化操作提示优化工作流；AGENTS（2023）提供模块化开源库；OpenAgents（2023）构建Web交互平台；ChatDev（2023）实现虚拟公司式软件开发；CAMEL（2023）运用角色扮演生成对话数据；AgentSims（2023）创建沙盒测试环境。最新提出的

大模型-智能体-【篇六： Autogen Studio、CrewAI vs AutoGen】

本文对比分析了两个智能体框架：Microsoft的AutogenStudio和CrewAI。AutogenStudio是建立在AutoGen框架上的UI应用（2024.01发布），提供详细安装教程但尚未成熟。CrewAI更适合熟悉LangChain的开发者，学习曲线较AutoGen平缓。

大模型-智能体-【篇五： Autogen、CrewAI、Autogen MultiAgent】

本文介绍了三种智能体框架：Autogen（微软2023.03发布，支持多智能体协同）、CrewAI（2023.11推出，作为Autogen替代方案）和AutogenMultiAgent（通过API集成扩展功能）。重点展示了各框架的项目链接、发布时间和核心功能，包括Autogen的多智能体协同、CrewAI的具体实现示例，以及AutogenMultiAgent通过API实现的群聊、应用开发和旅游代理

大模型-智能体-【篇四： Agent GPT 、AgentTuning、LangChain-Agent】

本文介绍了三种智能体框架：AgentGPT、AgentTuning和LangChain-Agent。AgentGPT（2023.04）是一个浏览器运行的Agent项目，支持GPT-4模型调用；AgentTuning（2023.10）是清华大学与智谱AI提出的方法，通过构建AgentInstruction数据集和混合指令微调提升LLM的Agent能力；LangChain-Agent则提供了多种代理类

大模型-智能体-【篇三： AutoGPT 、BabyAGI 、HuggingGPT】

本文介绍了三种主流智能体框架：1）AutoGPT（基于GPT-4/3.5的任务自动化工具）；2）BabyAGI（支持多模型的任务管理系统）；3）HuggingGPT（自动调用Huggingface模型的AI调度系统）。分别从发布时间、项目链接、核心功能和使用方法进行说明，其中AutoGPT近期移除了向量数据库支持，BabyAGI支持任务优先级管理，HuggingGPT能自动分析需求并调用合适模型。

大模型-训练-【篇五：后训练-强化学习】

本文介绍了强化学习（RL）的演进路径，重点对比了不同奖励机制：RLHF（人类反馈）、RLAIF（AI反馈）、RLVR（可验证奖励），以及过程监督和评分标准奖励。RLVR在数学推理和代码能力方面表现突出。文章还比较了PPO、GRPO等RL算法特性。

大模型-训练-【篇四：后训练-基础了解&SFT】

随着预训练边际效益递减，后训练技术(SFT和强化学习)成为提升模型性能的关键，重点在于数据质量优化。SFT阶段需处理标签噪声、分布不匹配等问题，通过过滤/验证/数据增强建立高质量pipeline。训练时采用动态批处理等技术提升效率，使用改进的交叉熵损失函数避免数值问题。后训练核心是对齐模型行为（如诚实性）并强化预训练能力。

#机器学习 #深度学习

共 45 条

请选择