logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

昇腾多模态模型套件 MindSpeed MM 介绍

华为昇腾推出MindSpeed MM多模态大模型训练推理套件,深度适配昇腾NPU硬件,提供一站式解决方案。该套件具有四大核心优势:1)模块化架构支持图文理解、生成及全模态统一模型;2)混合并行技术实现高效分布式训练;3)内存优化技术降低20%+显存占用;4)开箱即用特性兼容主流开源生态。套件包含30+预置模型,支持从数据处理到部署的全流程,在昇腾910B上实现多模态理解模型吞吐提升23.9%、文生

#语言模型#算法#性能优化
昇腾多模态模型套件 MindSpeed MM 介绍

华为昇腾推出MindSpeed MM多模态大模型训练推理套件,深度适配昇腾NPU硬件,提供一站式解决方案。该套件具有四大核心优势:1)模块化架构支持图文理解、生成及全模态统一模型;2)混合并行技术实现高效分布式训练;3)内存优化技术降低20%+显存占用;4)开箱即用特性兼容主流开源生态。套件包含30+预置模型,支持从数据处理到部署的全流程,在昇腾910B上实现多模态理解模型吞吐提升23.9%、文生

#语言模型#算法#性能优化
昇腾多模态模型套件 MindSpeed MM 介绍

华为昇腾推出MindSpeed MM多模态大模型训练推理套件,深度适配昇腾NPU硬件,提供一站式解决方案。该套件具有四大核心优势:1)模块化架构支持图文理解、生成及全模态统一模型;2)混合并行技术实现高效分布式训练;3)内存优化技术降低20%+显存占用;4)开箱即用特性兼容主流开源生态。套件包含30+预置模型,支持从数据处理到部署的全流程,在昇腾910B上实现多模态理解模型吞吐提升23.9%、文生

#语言模型#算法#性能优化
MindSpore Transformers 训推一体化 Mcore 架构介绍

MindSpore Transformers Mcore架构是昇思大模型套件的核心创新,通过五大设计实现高效开发:1)模块化组件抽象,标准化Transformer层;2)训推一体化架构,统一训练推理接口;3)声明式配置开发,模型定义代码减少85%;4)自动多维并行,支持数据/张量/流水线/专家并行;5)兼容Hugging Face生态,实现开源模型天级迁移。该架构支持Llama、Qwen等主流模型

#架构#神经网络#分布式 +1
MindSpore Transformers 训推一体化 Mcore 架构介绍

MindSpore Transformers Mcore架构是昇思大模型套件的核心创新,通过五大设计实现高效开发:1)模块化组件抽象,标准化Transformer层;2)训推一体化架构,统一训练推理接口;3)声明式配置开发,模型定义代码减少85%;4)自动多维并行,支持数据/张量/流水线/专家并行;5)兼容Hugging Face生态,实现开源模型天级迁移。该架构支持Llama、Qwen等主流模型

#架构#神经网络#分布式 +1
MindSpore Transformers 训推一体化 Mcore 架构介绍

MindSpore Transformers Mcore架构是昇思大模型套件的核心创新,通过五大设计实现高效开发:1)模块化组件抽象,标准化Transformer层;2)训推一体化架构,统一训练推理接口;3)声明式配置开发,模型定义代码减少85%;4)自动多维并行,支持数据/张量/流水线/专家并行;5)兼容Hugging Face生态,实现开源模型天级迁移。该架构支持Llama、Qwen等主流模型

#架构#神经网络#分布式 +1
MindSpore Transformers 训推一体化 Mcore 架构介绍

MindSpore Transformers Mcore架构是昇思大模型套件的核心创新,通过五大设计实现高效开发:1)模块化组件抽象,标准化Transformer层;2)训推一体化架构,统一训练推理接口;3)声明式配置开发,模型定义代码减少85%;4)自动多维并行,支持数据/张量/流水线/专家并行;5)兼容Hugging Face生态,实现开源模型天级迁移。该架构支持Llama、Qwen等主流模型

#架构#神经网络#分布式 +1
昇思深度学习原理简介

昇思MindSpore是华为自主研发的深度学习框架,具有动静统一编程、源码转换式自动微分、全场景中间表示等核心技术特点。该框架采用四层架构设计,支持从模型开发到部署的全流程优化,实现动态图调试与静态图性能的统一。通过MindIR中间表示和自动并行技术,昇思能高效支持大模型训练和异构硬件协同计算。其创新性地通过源码转换实现自动微分,并原生支持控制流求导,显著降低了深度学习开发门槛。该框架深度适配昇腾

#深度学习#人工智能
昇思深度学习原理简介

昇思MindSpore是华为自主研发的深度学习框架,具有动静统一编程、源码转换式自动微分、全场景中间表示等核心技术特点。该框架采用四层架构设计,支持从模型开发到部署的全流程优化,实现动态图调试与静态图性能的统一。通过MindIR中间表示和自动并行技术,昇思能高效支持大模型训练和异构硬件协同计算。其创新性地通过源码转换实现自动微分,并原生支持控制流求导,显著降低了深度学习开发门槛。该框架深度适配昇腾

#深度学习#人工智能
昇思深度学习原理简介

昇思MindSpore是华为自主研发的深度学习框架,具有动静统一编程、源码转换式自动微分、全场景中间表示等核心技术特点。该框架采用四层架构设计,支持从模型开发到部署的全流程优化,实现动态图调试与静态图性能的统一。通过MindIR中间表示和自动并行技术,昇思能高效支持大模型训练和异构硬件协同计算。其创新性地通过源码转换实现自动微分,并原生支持控制流求导,显著降低了深度学习开发门槛。该框架深度适配昇腾

#深度学习#人工智能
    共 1929 条
  • 1
  • 2
  • 3
  • 193
  • 请选择