登录社区云,与社区用户共同成长
邀请您加入社区
MFU(Model Flop Utilization,模型浮点运算利用率)是衡量大模型训练 / 推理效率的核心指标,用于量化硬件(如 GPU)的浮点运算能力被模型实际利用的比例。其计算原理围绕 “理论最大算力” 与 “模型实际消耗算力” 的比值展开,直接反映了硬件资源的利用效率。在深度学习领域,评估模型的计算量通常涉及到多个指标,其中MACs(Multiply-Accumulate Operati
作者:昇腾实战派 x 哒妮滋T5模型,是 Transfer Text-to-Text Transformer 的简写;Transfer 来自 Transfer Learning,预训练模型大体在这范畴,Transformer 也不必多说,Text-to-Text 是作者在这提出的一个统一训练框架,将所有 NLP 任务都转化成 Text-to-Text (文本到文本)任务。英德翻译:只需将训练数据集
引言 AI应用如火如荼,而嵌入式设备与AI的结合也是不可或缺的重要场景。香橙派 AI pro 开发板正是面向嵌入式AI场景而生。 这篇文章记录了对香橙派 AI pro开发板的试用体验。介绍了开发板的基础操作,以及对其中一个AI应用样例的体验,初步感受下 AI 开发板的特别魅力。 开发板基础操作部分,我是远程SSH登录后开启Jupyter,之后通过浏览器访问开发板IP即可操作,跳过了繁琐了远程桌面工
摘要 cann-recipes-embodied-intelligence仓库旨在针对具身智能业务中的典型模型、加速算法,提供基于CANN平台的优化样例,方便开发者简单、快速、高效地基于CANN平台使用具身智能模型。丰富CANN开源开放生态。 基于lerobot库,在昇腾Atlas A2环境适配pi0机器人端到端VLA具身智能大模型,通过使能昇腾融合算子、图模式、计算逻辑优化等手段,实现了较低的推
作者:昇腾实战派 一、PaddlePaddle(飞桨)技术入门 参考开源文档 部署&&快速开始: https://www.paddleocr.ai/latest/quick_start.html 飞桨官方昇腾推理参考链接: https://github.com/PaddlePaddle/PaddleX/blob/release/3.2/docs/practical_tutorial
每张卡上的 module,api,kernel(O0)组成了一个Ranknode(O1),不同的 Ranknode 组成对应的T/D/PP域节点(O1.5),不同的并行域节点拼合形成完整(model)micro_step(O2),不同 micro step拼合形成 step(O3),多个step拼合形成区域段数据集表现,一般就loss趋势等。下面探讨精度问题定位过程中几个核心步骤。
本文从宏观的角度梳理了训练的大致流程,分析了精度问题在训练流程中的表现,梳理了针对训练各环节进行相应数据采集和分析的工具。 概览图 基本概念 训练流程 概览图的上半部分展示了一个大模型训练的完整流程,从数据输入到权重更新,大体上分为以下五个部分: 准备阶段 (START 之前):左侧的“weight、dataset、env(sys env)、CANN/CUDA、config”代表训练所需的输入条件
背景 首先,感谢OrangePi联合华为办的活动以及邀请评测,其实我们观察华为的昇腾芯片很久。在平常项目开发中,都是使用的Nvidia的Jetson系列芯片进行边缘AI计算开发,由于使用场景受限的问题,我们必须得考虑国产替代方案 。这次,我将使用Orange Pi Alpro板卡进行单目标跟踪算法的部署以及算力评测,以此来了解昇腾芯片在今后使用的可行性,同时,也和大家一起分享Orange Pi
香橙派 AI pro:AI 加速初体验 在AI领域,不断涌现的硬件产品为开发者提供了前所未有的便利和可能性。今天,我要介绍的这款产品——香橙派 AIpro,就是其中的佼佼者。在昇腾 AI 芯片的加持下,这款开发板有着出色的算力。这不仅仅是一块开发板,更是一个为AI开发者量身打造的平台,最近,我也是拿到了官方送来的香橙派AIpro开发板。 官方资料 OrangePi AIpro 官网 Orange
前言 Orange Pi AI Pro 开发板是香橙派联合华为精心打造的高性能 AI 开发板,其搭载了昇腾 AI 处理器,可提供 8TOPS INT8 的计算能力,内存提供了 8GB 和 16GB两种版本。可以实现图像、视频等多种数据分析与推理计算,可广泛用于教育、机器人、无人机等场景。 OrangePi AIpro(8T)采用昇腾AI技术路
首先非常感谢csdn以及香橙派能够提供这样一个平台,可以测试OrangePi AIpro这样一块开发板,这块板子给我的感觉还是非常不错的,非常适合用来作为嵌入式学习的板子,性能也达到了一定要求,可以跑一些深度学习的任务了。 下面的文章我将总结我使用这块板子做的一些事情。 1、外观部分 先看官方宣传图吧,香橙派风格&
OrangePi AIpro初步使用VNC连接并运行样例 参考资料 官方资料参考 香橙派官方资料Orange Pi AIpro Orange Pi官网-香橙派(Orange Pi)开发板 昇腾社区论坛-OrangePi AIpro 板块Orange Pi AIpro_昇腾论坛 (hiascend.com) 官方资料下载合集 香橙派官方资料百度网盘链接https://pan.baidu.com/
昇腾AI解决方案
——昇腾AI解决方案
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net