weixin_52958040 个人主页

@weixin_52958040

weixin_52958040

2024-10-24 10:22:08 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

昇腾NPU适配Ola-Omni全模态大模型实战

本文基于昇腾CANN生态，成功实现了全模态语言模型Ola-Omni在昇腾NPU上的端到端训练适配。通过环境搭建、代码适配和三阶段微调训练的全流程实践，验证了该模型在国产算力平台上的可行性。关键成果包括：完成环境配置与依赖处理，实现自动迁移和性能优化，三阶段微调训练loss稳定下降。该实践为全模态大模型在昇腾平台的部署提供了可复用方案，展现了国产AI生态在多模态领域的应用潜力。

#人工智能 #经验分享

昇腾NPU适配Ola-Omni全模态大模型实战

#人工智能 #经验分享

昇腾NPU适配Ola-Omni全模态大模型实战

#人工智能 #经验分享

昇腾平台基于align-anything 的PPO训练Host Bound性能优化实践

在大语言模型的强化学习训练过程中，PPO（Proximal Policy Optimization）算法因其稳定性和效率而被广泛应用。在昇腾Atlas 800T A2上基于Align-Anything框架进行Qwen2.5-0.5B模型PPO训练时遇到性能瓶颈问题，经过分析，整体性能影响主要受到Host侧下发约束，本文将详细介绍完整的性能分析与优化过程。本次优化实践表明，通过系统的性能分析、常规优

#性能优化 #人工智能

昇腾平台基于align-anything 的PPO训练Host Bound性能优化实践

#性能优化 #人工智能

昇腾平台基于align-anything 的PPO训练Host Bound性能优化实践

#性能优化 #人工智能

到底了