logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从文字应答到具象共情:Agent 交互的底层革新

魔珐星云具身Agent突破传统文本交互模式,通过表情、手势与情绪的联动实现自然化人机交互。

文章图片
#交互#microsoft#ar +4
深度计算编程范式:PyPTO 架构下的张量分块与并行调度优化

PyPTO 不仅仅是一个固定的框架,它允许开发者以模块化的方式自定义复杂算子。开发者可以基于 PyPTO 的内存和同步管理机制,集成自定义的 Ascend C 核心计算逻辑,并将其无缝接入到双缓冲流水线中。

#架构
GE 引擎进阶:依赖图的原子性管理与异构算子协作调度

GE 引擎是 CANN 软件栈的核心编译优化层。它通过版本化的签名管理、启发式的图重写(Predication/Fusion)以及资源约束下的静态规划,有效地将上层框架定义的复杂、动态模型,转化为一个高效、确定性的、适配 NPU 硬件数据流架构的执行蓝图。

#人工智能#java#开发语言
CANN PyPTO 编程范式深度解析:并行张量计算架构、分块调度逻辑与片上内存控制机制

PyPTO 的核心是定义 Tile 的计算行为,并依赖框架将此行为扩展到整个硬件集群。

#架构#大数据#linux
驱动架构核心:CANN Driver 的资源管理与任务流引擎解析

在异构计算体系中,驱动模块(Driver)是连接上层软件生态与底层物理硬件的唯一通道。CANN Driver 负责对计算处理器(NPU)的物理资源进行精细化管理和抽象,并将复杂的计算请求转化为硬件可识别的任务描述符。它的高效运作是所有上层应用(如算子库、图引擎、Runtime)高性能运行的基石。

#linux
CANN metadef 深度解析:计算图元数据定义与异构 IR 规范

异构硬件对访存效率高度敏感。私有格式 NC1HWC0:metadef 为这种格式提供了唯一的标识符和转换逻辑标识。该格式通过将通道维度(C)分块为 C1 和 C0(通常为 16),使得数据能够以符合 NPU Cube Unit 计算模式的方式进入片上缓冲区。TransData 依赖:metadef 定义的格式信息指导 GE 在编译时自动插入格式转换算子(TransData)。

#大数据#linux
CANN metadef 架构解析:算子原型定义、计算图中间表示与异构内存布局规范

算子原型是描述算子“行为”的核心文档,它在编译阶段就锁定了算子的输入输出约束和配置空间。

#linux#大数据#docker
CANN metadef 核心解析:计算图原型定义、算子元数据抽象与异构系统互操作机制

内存布局格式直接影响访存效率。基础格式:如 NCHW, NHWC,作为前端框架的输入/输出标准。硬件私有格式:如NC1HWC0。metadef 提供了这些格式的唯一标识符及其维度计算规则,指导 GE 在编译时插入格式转换算子(TransData)以适配 NPU 的 Cube Unit。metadef 仓库通过对计算图、算子、张量及 Tiling 信息的标准化定义,为 CANN 平台构建了稳固的元数

#docker#容器
CANN ATVOSS 算子库深度解析:基于 Ascend C 模板的 Vector 算子子程序化建模与融合优化机制

ATVOSS 提供了开放的接口规范,支持开发者自定义子程序。由于其基于 C++ 模板,新定义的子程序可以无缝融入现有的融合链条中,并享受到框架提供的流水线管理和内存优化服务。// ATVOSS 子程序模板调用示例:实现向量加法与非线性激活的融合public:// Step 1: 向量加法// 临时缓冲区// Step 2: 激活函数 ReLU,利用 Add 的结果原地计算。

#大数据#人工智能
    共 25 条
  • 1
  • 2
  • 3
  • 请选择