
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
摘要 本文介绍了在Atlas 800I A2硬件上基于MindIE服务部署和评测DeepSeek-R1模型的完整流程。内容包括:模型权重下载方法、MindIE容器环境配置、服务化部署步骤(包括配置修改和权限设置)、lighteval评测框架的源码安装,以及自定义评测任务的编写方法。重点解决了带思维链模型的测评难题,提供了针对AIME、MATH-500等数据集的评测方案。整个流程已验证可在指定硬件和
飞桨x昇腾生态适配方案:04_算子适配
飞桨x昇腾生态适配方案:07_离线推理
飞桨x昇腾生态适配方案:00_整体介绍
GRIN-MOE模型适配昇腾NPU(二):权重加载、前向对齐
飞桨x昇腾生态适配方案:01_环境准备
worldsize = NNODES * NPUS_PER_NODE = DP * PP * TP * CPNNODES:服务器数量NPUS_PER_NODE:每台服务器NPU卡数MindSpeed-LLM没有配置数据并行DP的参数,是根据如下公式自动算出来的:DP = worldsize / (TP * PP * CP)注意:TP、PP、CP需手动配置,CP如果不配置默认是1DP = (NNOD
飞桨x昇腾生态适配方案:02_训练迁移
飞桨x昇腾生态适配方案:03_精度对齐
摘要 本文介绍了在Atlas 800I A2硬件上基于MindIE服务部署和评测DeepSeek-R1模型的完整流程。内容包括:模型权重下载方法、MindIE容器环境配置、服务化部署步骤(包括配置修改和权限设置)、lighteval评测框架的源码安装,以及自定义评测任务的编写方法。重点解决了带思维链模型的测评难题,提供了针对AIME、MATH-500等数据集的评测方案。整个流程已验证可在指定硬件和







