【2026年5月22日,北京】鲲鹏昇腾开发者大会2026(KADC2026)期间,面向超节点,打造开源易用的昇腾AI框架专题论坛顺利举办。

论坛聚焦超节点技术创新与开源生态建设,全方位展示了昇腾AI框架的最新进展。会上正式发布了Ascend for PyTorch社区,并深度复盘了昇思MindSpore在分布式并行、图算融合等前沿领域的创新成果作为组件化支撑PyTorch等三方社区合作。

多位学术界与产业界大咖也分享了基于昇腾AI框架共创成果以及高校开发者在API一致性补齐中的技术路线。线下更吸引了数百位开发者沉浸式体验,有力彰显了昇腾与开发者同行、共筑繁荣AI生态的决心。

图片 1.png

PART 01

图片 2.png

华为AI框架PE 王紫东

华为AI框架PE王紫东在《技术筑底,开源向新——昇腾AI框架与开发者同行》的主题演讲中表示,从开发者使用习惯出发,围绕开发一致性、组件化创新、开发者体验三个方向,持续优化开发者体验,提供高效成长路径。

联合PyTorch基金会成立Ascend for PyTorch社区,加速开发一致性对齐。面对PyTorch版本发布节奏加快,图模型、分布式代码提交占比增高,将利用Ascend for PyTorch社区聚集开发者力量加速API一致性对齐、特性对齐,实现昇腾开发一致体验。并配合PyTorch社区重构CICD,年底实现PyTorch版本在昇腾上同步发布。

面向超节点,昇思MindSpore打造昇腾亲和组件,加速主流生态对昇腾使用优化。昇思MindSpore聚焦超节点技术创新,在分布式、图模式领域构建HyperParallel、AKG等昇腾亲和组件,并支持PyTorch,LlamaFactory等主流生态复用,做好创新先头兵。

开源社区,百万激励,助力开发者快速融入社区共建。为开发者提供2000+社区任务&竞赛活动和全方位的算力、激励,助力开发者共成长。同时优化社区、文档和课程等开发者资源,加速开发者学习到贡献路径。

PART 02

图片 3.png

LlamaFactory社区Maintainer  郑耀威

LlamaFactory社区Maintainer郑耀威带来《LlamaFactory × HyperParallel:重构大模型训练效率新范式》的议题分享。针对大模型微调中分布式编程复杂、调试困难及算力成本高昂等痛点,LlamaFactory以统一易用的架构大幅降低了微调门槛,而HyperParallel则开创了分布式并行的“Triton范式”,让高效并行如同编写串行代码般自然。

通过双方的深度解耦共建,开发者只需一行配置即可启用HyperParallel,实现分布式加速,让高效微调训练真正“开箱即用”。

PART 03

图片 4.png

昇思MindSpore社区开发者 杜金烨/李希宸

昇思MindSpore社区开发者杜金烨和李希宸共同带来《AKG 图算融合组件,使能昇腾大模型图模式加速》的演讲,系统性介绍了关于AKG图算融合的多个组件包括基于 MLIR 的图层融合框架 MFusion、AI 融合算子编译器AKG-Scheduler、实时AI算子编译 DVM 与 AI 驱动的 DSL 代码生成工具 AKG-Agent。并且对 AKG-Scheduler 关键创新融合算法反向拉取算法进行详细介绍。

同时也介绍了北航 HIPO 团队基于 AKG-Agent 的创新性 Agent 元提示方案,在设计、编码等多个模块上实现高质量提示词,实现 Triton 后端上精度与性能多方面提升。搭载LLM驱动的DSL生成,自动寻优性能提升显著。组件化可一键部署,零代码优化模型训推,编译时长降低50%+,目前已合入主线,全面赋能昇腾大模型图模式加速。

PART 04

图片 5.png

PyTorch Ambassador宗泽升

PyTorch Ambassador宗泽升在《PyTorch 多后端生态面临的挑战与标准化建设》议题中介绍了为PyTorch生态系统当前的最新进展,以及PyTorch框架接入机制技术演进。讲解了作为后端加速器开发者在社区贡献过程中遇到的挑战、解决方案和案例研究。

针对新设备接入PyTorch过程中,面临的版本兼容性、用例无法复用、缺乏标准化质量验证机制问题。通过PyTorch加速器工作组在社区中征集意见,推进PyTorch测试框架重构、提供CI Relay机制、Hud Dashboard接入等能力事项,为社区后端加速器验证提供基础能力保障。

PART 05

图片 6.png

面壁智能多模态首席科学家、清华大学人工智能学院助理教授 姚远

面壁智能多模态首席科学家、清华大学人工智能学院助理教授 姚远以“迈向类人交互的多模态大模型”为题,分享了MiniCPM-o 4.5在全模态交互方向的最新进展。该模型面向“边看、边听、主动说”的实时场景,支持视觉、语音、文本的端到端统一建模,可实现全双工输入输出、低延迟语音生成、自主打断、插话与主动回复。现场演示中,模型展现出流畅自然的多模态实时交互能力,能够像真人一样根据画面、语音和上下文即时响应,带来更具陪伴感和沉浸感的人机对话体验。

此前,面壁智能/OpenBMB 已与华为昇腾生态围绕 AI 框架、分布式训练、模型架构优化和国产算力开展合作探索,本次双方将进一步推出 OpenBMB × 华为昇腾AI框架联合赛事,围绕 MiniCPM-o系列模型在昇腾NPU上的推理适配、性能优化与创新应用,鼓励高校学生和开发者共同探索全模态模型的产业化落地。

PART 06

图片 7.png

Ascend for PyTorch社区开发者 刘劲帆

Ascend for PyTorch社区开发者 刘劲帆围绕“API 一致性补齐实践”进行了分享,系统介绍了 PyTorch 生态向昇腾NPU 迁移过程中的关键工程问题。

API一致性是在昇腾上使用PyTorch生态的核心基石。PyTorch作为AI领域事实标准,一致性对齐并不是简单“改几行代码”或新增接口,而是要准确理解 PyTorch 官方语义,实现API与官方语义对齐可实现从“能跑”到“可信迁移”的跨越,保障接口功能、行为、测试与文档全维度一致,以此降低开发者代码改造成本。

API一致性正在流程化作业,与开发者共同探索加速。目前和30+位开发者归纳流程标准,大家遵循检索、判断、适配、验证、提交的标准化工程闭环,聚焦用例、功能、文档三类补齐工作,通过issue与PR完成问题定位、适配修复与验证提交。开发者们携手攻克测试检索、适配边界、多版本兼容等实践难点,沉淀规范流程与协作经验,合力提交大量issue与PR,持续提升API一致性与可信度,共同推动在昇腾上使用PyTorch的开发体验一致。

未来,昇腾AI框架将持续围绕开源易用为目标,携手生态力量为开发者提供一致开发体验和创新技术,让开发过程好用易用!


「免责声明」:以上页面展示信息由第三方发布,目的在于传播更多信息,与本网站立场无关。我们不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资建议,据此操作,风险自担,以上网页呈现的图片均为自发上传,如发生图片侵权行为与我们无关,如有请直接微信联系g1002718958。 

更多推荐