logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型-提示工程

本文系统介绍了大语言模型(LLM)的类型与使用方法,重点对比了基础大模型(基于概率预测)和指令微调模型(通过RLHF优化)的差异。详细阐述了ChatGPT提问的两大核心原则:1)编写清晰具体的指令(使用分隔符、结构化输出等技巧);2)给予模型思考时间(分步推理等)。同时介绍了温度参数、角色权重等接口设置,并提供了总结、推断等5种典型应用场景。

文章图片
图神经网络(篇三)-基础知识

《深入浅出图神经网络-GNN原理解析》配套代码资源汇总,包含GCN、GraphSage、图分类和图自编码器等实战章节的PyTorch实现。书籍涵盖图神经网络基础理论、GCN性质、GNN变体与应用等内容,并引用多篇前沿论文。作者为互联网大厂算法专家,提供算法面试辅导与专业知识指导。配套代码链接详见文中,欢迎读者点赞收藏评论互动,共同探讨GNN技术。

文章图片
#神经网络#深度学习#人工智能
大模型-智能体-【篇二:多智能体框架】

本文综述了近年来7种多智能体协作框架:AutoGen(2023)支持自然语言交互和多工具组合;MetaGPT(2023)采用标准化操作提示优化工作流;AGENTS(2023)提供模块化开源库;OpenAgents(2023)构建Web交互平台;ChatDev(2023)实现虚拟公司式软件开发;CAMEL(2023)运用角色扮演生成对话数据;AgentSims(2023)创建沙盒测试环境。最新提出的

文章图片
大模型-训练-【篇四:后训练-基础了解&SFT】

随着预训练边际效益递减,后训练技术(SFT和强化学习)成为提升模型性能的关键,重点在于数据质量优化。SFT阶段需处理标签噪声、分布不匹配等问题,通过过滤/验证/数据增强建立高质量pipeline。训练时采用动态批处理等技术提升效率,使用改进的交叉熵损失函数避免数值问题。后训练核心是对齐模型行为(如诚实性)并强化预训练能力。

文章图片
#机器学习#深度学习
大模型-训练-【篇三:微调】

PEFT(参数高效微调)是一种在不调整全部模型参数的情况下将预训练语言模型适配下游任务的技术库。它通过微调少量参数显著降低计算和存储成本,同时保持与全参数微调相当的性能。主流方法包括AdapterTuning、PrefixTuning、PromptTuning、LoRA等,其中LoRA通过低秩矩阵模拟全参数微调,在推理时无额外计算开销。P-Tuning及其改进版本通过多层提示编码提升小模型表现。这

文章图片
#人工智能
大模型-模型系列(篇五)-DeepSeek

涵盖DeepSeek模型部署、评测、复现及核心技术解析。重点包括:1)DeepSeek-R1模型的本地/云端部署方案及硬件配置指南;2)开源复现项目进展,包括基于Qwen架构的复现实践;3)核心技术解析,如混合专家模型(MoE)、知识蒸馏、强化学习算法GRPO等;4)生态工具链更新,如Zotero文献助手、KTransformer推理优化;5)性能评测显示1.5B参数模型数学能力超越GPT-4o。

文章图片
大模型-就业方向

本文介绍了大模型就业方向:基座模型训练、大模型微调、大模型开发、大模型推理部署、多模态大模型等

文章图片
#深度学习#人工智能
大模型-幻觉

大模型幻觉是AI生成与事实不符内容的现象,在创作场景中可能有益,但在医疗等专业领域需避免。幻觉可分为语境冲突性和事实冲突性两类,产生原因包括数据缺陷、训练不当和生成策略问题。评估方法包括生成事实陈述和判别式基准评估。缓解策略主要有:构建高质量微调数据、强化诚实对齐、优化解码策略和外挂知识库增强。需注意大模型无法自知其知识边界,现有方法只能缓解而无法根除幻觉。不同应用场景需采取针对性措施,知识图谱等

文章图片
#人工智能#知识图谱
大模型-训练-【篇二:训练加速&工具】

本文系统介绍了大模型训练中的并行优化策略,重点对比了FSDP和DeepSpeed两种主流方案。主要内容包括:1) PyTorch FSDP借鉴DeepSpeed ZeRO和FairScale思想,实现参数/梯度/优化器状态的分片管理;2) 详细解析数据并行(DDP)的通信优化机制和ZeRO三阶段(优化器/梯度/参数分片)的显存优化原理;3) 对比3D并行(TP+PP+DP)与ZeRO的协同使用;4

文章图片
大模型-模型融合

本文介绍了大模型融合的5种方法:1)模型整合(如EoT跨模型通信);2)概率集成(词表输出概率融合);3)嫁接学习(结构权重嫁接+继续预训练);4)众包投票;5)MoE(如GShard、Switch Transformers等)。重点解析了各类方法的技术原理与应用场景,如GShard的Top-2门控、Switch的Top-1策略等。

文章图片
    共 24 条
  • 1
  • 2
  • 3
  • 请选择