
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文档详细记录了针对 Qwen2-VL 和 janus_pro 模型的关键性能优化点,并附带了相应的核心代码实现。
本文档详细记录了针对 Qwen2-VL 和 janus_pro 模型的关键性能优化点,并附带了相应的核心代码实现。
本文档详细记录了针对 Qwen2-VL 和 janus_pro 模型的关键性能优化点,并附带了相应的核心代码实现。
MindSpore作为昇腾AI生态的核心深度学习框架,凭借自动微分、动静结合、端边云全场景部署等特性,成为昇腾平台上模型开发的首选工具。在实际模型训练过程中,开发者常面临训练速度慢、显存占用高、资源利用率低等问题。本文结合MindSpore框架特性与昇腾硬件优势,从数据预处理、网络结构优化、训练策略调整、显存优化四个核心维度,分享模型训练的优化思路与实战方法,助力开发者在昇腾平台上高效完成模型训练
MindSpore作为昇腾AI生态的核心深度学习框架,凭借自动微分、动静结合、端边云全场景部署等特性,成为昇腾平台上模型开发的首选工具。在实际模型训练过程中,开发者常面临训练速度慢、显存占用高、资源利用率低等问题。本文结合MindSpore框架特性与昇腾硬件优势,从数据预处理、网络结构优化、训练策略调整、显存优化四个核心维度,分享模型训练的优化思路与实战方法,助力开发者在昇腾平台上高效完成模型训练
MindSpore作为昇腾AI生态的核心深度学习框架,凭借自动微分、动静结合、端边云全场景部署等特性,成为昇腾平台上模型开发的首选工具。在实际模型训练过程中,开发者常面临训练速度慢、显存占用高、资源利用率低等问题。本文结合MindSpore框架特性与昇腾硬件优势,从数据预处理、网络结构优化、训练策略调整、显存优化四个核心维度,分享模型训练的优化思路与实战方法,助力开发者在昇腾平台上高效完成模型训练
【代码】昇腾 CL 和 MindSpore 助力 ResNet50 推理。
【代码】昇腾 CL 和 MindSpore 助力 ResNet50 推理。
MindSpore以“端-边-云”全场景统一为核心定位,通过创新的四层架构设计与关键技术特性,破解了传统AI框架在开发效率、性能优化、场景适配等方面的痛点,实现了“易开发、高效执行、全场景部署”的核心目标。其动静统一的编程体验、精准的自动微分、透明的分布式并行与全场景协同能力,让AI技术从算法研究到产业落地的链路更加顺畅,为千行万业的数字化转型提供了强大的技术支撑。
基于MindFormers大模型套件中llama readme跑通的训练、评估、微调、推理整理的文档,适合初次接触大模型套件的童鞋入坑学习。








