社区云

昇腾AI大模型

AI 模力圈来自 2048 AI社区

2048ai.net · 2026-01-19 10:46:41

大模型FLOPs利用率_MFU计算方法与注意事项

MFU（Model Flop Utilization，模型浮点运算利用率）是衡量大模型训练 / 推理效率的核心指标，用于量化硬件（如 GPU）的浮点运算能力被模型实际利用的比例。其计算原理围绕 “理论最大算力” 与 “模型实际消耗算力” 的比值展开，直接反映了硬件资源的利用效率。在深度学习领域，评估模型的计算量通常涉及到多个指标，其中MACs（Multiply-Accumulate Operati

#昇腾AI大模型 #昇腾AI解决方案 #深度学习 +2

816 

8 
AI 模力圈来自昇腾开源生态专区

ascendai.csdn.net · 2026-01-09 14:16:47

T5 模型：NLP Text-to-Text 预训练模型超大规模探索

作者：昇腾实战派 x 哒妮滋T5模型，是 Transfer Text-to-Text Transformer 的简写；Transfer 来自 Transfer Learning，预训练模型大体在这范畴，Transformer 也不必多说，Text-to-Text 是作者在这提出的一个统一训练框架，将所有 NLP 任务都转化成 Text-to-Text （文本到文本）任务。英德翻译：只需将训练数据集

#自然语言处理 #人工智能 #python +4

720 

14 
AI 模力圈来自 2048 AI社区

2048ai.net · 2025-12-29 11:09:54

大模型训练精度问题表现及工具使用

每张卡上的 module,api,kernel（O0）组成了一个Ranknode（O1），不同的 Ranknode 组成对应的T/D/PP域节点（O1.5），不同的并行域节点拼合形成完整（model）micro_step（O2），不同 micro step拼合形成 step（O3），多个step拼合形成区域段数据集表现，一般就loss趋势等。下面探讨精度问题定位过程中几个核心步骤。

#昇腾AI大模型 #昇腾AI解决方案

745 

12 
AI 模力圈来自鲲鹏昇腾开发者社区

hwcomputing.csdn.net · 2025-12-29 11:09:54

大模型训练精度问题表现及工具使用

本文从宏观的角度梳理了训练的大致流程，分析了精度问题在训练流程中的表现，梳理了针对训练各环节进行相应数据采集和分析的工具。概览图基本概念训练流程概览图的上半部分展示了一个大模型训练的完整流程，从数据输入到权重更新，大体上分为以下五个部分：准备阶段（START 之前）：左侧的“weight、dataset、env（sys env）、CANN/CUDA、config”代表训练所需的输入条件

#昇腾AI解决方案 #昇腾AI大模型

12 
kuan_li_lyg 来自鲲鹏昇腾开发者社区

hwcomputing.csdn.net · 2024-05-31 10:24:30

OrangePi AIpro 机器人仿真与人工智能应用测评

前言本篇文章分为2个部分，第一部分主要搭建了机器人的仿真环境（ROS2 MuJoCo等），运行了机械臂及移动机器人相关示例程序；第二部分运行了OrangePi AIpro系统自带的示例程序及昇腾社区官方的示例程序；最后总结使用体验。一、开发板软硬件 1.1 硬件介绍及准备这里我找了几块开发板，左边为

#昇腾AI大模型 #物联网 #机器人 +2

104 

1 
知识浅谈来自鲲鹏昇腾开发者社区

hwcomputing.csdn.net · 2024-05-27 12:22:44

拥抱香橙派AIPro,解锁目标检测智慧算力

拥抱香橙派AIPro,解锁目标检测智慧算力，香橙派AIPro,由香橙派联合华为精心打造，建设人工智能新生态的高端产品，采用昇腾AI技术路线，拥有8TOPSAI算力，8GB/16GB的LPDDR4X内存

#昇腾AI大模型 #AI

54 

1 

标签介绍

昇腾AI大模型

——昇腾AI大模型

热门标签

关于我们

联系我们（工作时间：8:30-22:00）

400-660-0108 kefu@csdn.net