
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文基于华为云 ModelArts 的 CANN 环境,成功复现了 LLaMA-2-7B 开源大模型的昇腾适配过程,并通过实验数据验证了适配效果。从结果来看,昇腾 910B(CANN 7.0.RC1)在 LLaMA-2-7B 的推理性能上与 NVIDIA A100 接近,且显存占用控制良好,完全满足大模型的轻量化部署需求。基于华为开源的大模型适配仓,可快速完成 LLaMA、ChatGLM、Qwen
本文基于华为云 ModelArts 的 CANN 环境,成功复现了 LLaMA-2-7B 开源大模型的昇腾适配过程,并通过实验数据验证了适配效果。从结果来看,昇腾 910B(CANN 7.0.RC1)在 LLaMA-2-7B 的推理性能上与 NVIDIA A100 接近,且显存占用控制良好,完全满足大模型的轻量化部署需求。基于华为开源的大模型适配仓,可快速完成 LLaMA、ChatGLM、Qwen
本文基于华为云 ModelArts 的 CANN 环境,成功复现了 LLaMA-2-7B 开源大模型的昇腾适配过程,并通过实验数据验证了适配效果。从结果来看,昇腾 910B(CANN 7.0.RC1)在 LLaMA-2-7B 的推理性能上与 NVIDIA A100 接近,且显存占用控制良好,完全满足大模型的轻量化部署需求。基于华为开源的大模型适配仓,可快速完成 LLaMA、ChatGLM、Qwen
本文基于华为云 ModelArts 的 CANN 环境,成功复现了 LLaMA-2-7B 开源大模型的昇腾适配过程,并通过实验数据验证了适配效果。从结果来看,昇腾 910B(CANN 7.0.RC1)在 LLaMA-2-7B 的推理性能上与 NVIDIA A100 接近,且显存占用控制良好,完全满足大模型的轻量化部署需求。基于华为开源的大模型适配仓,可快速完成 LLaMA、ChatGLM、Qwen
如果你是做模型部署的,不用自己写所有算子(CANN有现成的CNN算子库);- 但如果想把模型在边缘设备上的速度再提20%,或者自定义特殊CNN算子——Ascend C是绕不开的工具,核心就是“顺着硬件的逻辑来”。2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级

如果你是做模型部署的,不用自己写所有算子(CANN有现成的CNN算子库);- 但如果想把模型在边缘设备上的速度再提20%,或者自定义特殊CNN算子——Ascend C是绕不开的工具,核心就是“顺着硬件的逻辑来”。2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级








