logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【MindSpeed+ vLLM-Ascend】Qwen3-Coder-Next模型上线,昇腾环境极速落地指南

Qwen3-Coder-Next 是面向编程智能体与本地开发的开源 MoE 代码模型,昇腾已同步完成 MindSpeed 与 vLLM-Ascend 适配。本文介绍模型核心特性,并手把手讲解在昇腾上的完整上手路径:MindSpeed-LLM 侧涵盖环境配置、HF 权重转换、预训练/微调数据预处理及训练推理脚本;vLLM-Ascend 侧涵盖 Docker 部署、离线/在线推理示例,助开发者快速尝鲜

文章图片
#人工智能
【MindSpeed+ vLLM-Ascend】Qwen3-Coder-Next模型上线,昇腾环境极速落地指南

Qwen3-Coder-Next 是面向编程智能体与本地开发的开源 MoE 代码模型,昇腾已同步完成 MindSpeed 与 vLLM-Ascend 适配。本文介绍模型核心特性,并手把手讲解在昇腾上的完整上手路径:MindSpeed-LLM 侧涵盖环境配置、HF 权重转换、预训练/微调数据预处理及训练推理脚本;vLLM-Ascend 侧涵盖 Docker 部署、离线/在线推理示例,助开发者快速尝鲜

文章图片
#人工智能
【MindSpeed+ vLLM-Ascend】Qwen3-Coder-Next模型上线,昇腾环境极速落地指南

Qwen3-Coder-Next 是面向编程智能体与本地开发的开源 MoE 代码模型,昇腾已同步完成 MindSpeed 与 vLLM-Ascend 适配。本文介绍模型核心特性,并手把手讲解在昇腾上的完整上手路径:MindSpeed-LLM 侧涵盖环境配置、HF 权重转换、预训练/微调数据预处理及训练推理脚本;vLLM-Ascend 侧涵盖 Docker 部署、离线/在线推理示例,助开发者快速尝鲜

文章图片
#人工智能
【MindSpeed】MindSpeed LLM无缝适配Step-3.5-Flash,解锁大规模MOE落地新可能

本期为大家介绍了基于MindSpeed LLM部署高效部署Step-3.5-Flash模型训练,更多关于大语言模型训练的能力和技术,欢迎开发者体验、贡献与共建!MindSpeed LLM 开源仓库昇腾开源微信小助手:ascendosc。

文章图片
#人工智能
【MindSpeed】MindSpeed LLM无缝适配Step-3.5-Flash,解锁大规模MOE落地新可能

本期为大家介绍了基于MindSpeed LLM部署高效部署Step-3.5-Flash模型训练,更多关于大语言模型训练的能力和技术,欢迎开发者体验、贡献与共建!MindSpeed LLM 开源仓库昇腾开源微信小助手:ascendosc。

文章图片
#人工智能
【MindSpeed】MindSpeed LLM无缝适配Step-3.5-Flash,解锁大规模MOE落地新可能

本期为大家介绍了基于MindSpeed LLM部署高效部署Step-3.5-Flash模型训练,更多关于大语言模型训练的能力和技术,欢迎开发者体验、贡献与共建!MindSpeed LLM 开源仓库昇腾开源微信小助手:ascendosc。

文章图片
#人工智能
【vLLM-Ascend】Qwen3-30B-A3B 模型在异步训练场景下的性能优化实践

本文基于 Atlas 800T A2,围绕 Qwen3-30B-A3B MoE 模型在异步 RL 训练场景下的全链路调优,覆盖 vLLM-Ascend 推理侧 EP/TP 切分、MoE 算子与 HCCL AIV 通信优化,以及 FSDP 训练侧 GMM 融合、Ulysses 负载均衡与 Megatron 对比选型;并完成 Fully-Async 架构在昇腾 NPU 上的适配,通过 stalenes

文章图片
#性能优化
【vLLM-Ascend】Qwen3-30B-A3B 模型在异步训练场景下的性能优化实践

本文基于 Atlas 800T A2,围绕 Qwen3-30B-A3B MoE 模型在异步 RL 训练场景下的全链路调优,覆盖 vLLM-Ascend 推理侧 EP/TP 切分、MoE 算子与 HCCL AIV 通信优化,以及 FSDP 训练侧 GMM 融合、Ulysses 负载均衡与 Megatron 对比选型;并完成 Fully-Async 架构在昇腾 NPU 上的适配,通过 stalenes

文章图片
#性能优化
【vLLM-Ascend】Qwen3-30B-A3B 模型在异步训练场景下的性能优化实践

本文基于 Atlas 800T A2,围绕 Qwen3-30B-A3B MoE 模型在异步 RL 训练场景下的全链路调优,覆盖 vLLM-Ascend 推理侧 EP/TP 切分、MoE 算子与 HCCL AIV 通信优化,以及 FSDP 训练侧 GMM 融合、Ulysses 负载均衡与 Megatron 对比选型;并完成 Fully-Async 架构在昇腾 NPU 上的适配,通过 stalenes

文章图片
#性能优化
VeOmni全面支持昇腾,加速全模态大模型训练创新

本文介绍全模态开源训练框架 VeOmni 在昇腾 NPU 上的原生支持进展,涵盖 FSDP/EP/SP 等并行能力与 Qwen3-VL 等主流模型适配;并以 Qwen3-VL 30B 为例,手把手讲解环境安装、数据准备、权重下载与训练启动,验证昇腾平台训练效果与参考曲线一致。

文章图片
#人工智能
    共 15 条
  • 1
  • 2
  • 请选择