logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

驾驭计算图元数据:Metadef 仓库深度解析

以下展示了 Metadef 中用于定义算子原型的结构化概念。// 概念性结构定义:算子原型注册// 这种设计允许编译器在不加载算子实现库(Kernel)的情况下// 仅通过原型库就能完成图的校验与推导public:// 1. 定义算子类型标识符// 2. 声明输入端口与其依赖的数据类型// 3. 声明输出端口// 4. 定义算子特有的属性(如 stride, dilation)// 支持设置默认值

#人工智能
深度解码 Metadef:构建计算图的通用“元”语言

以下展示了 Metadef 中用于定义算子原型的结构化概念。// 概念性结构定义:算子原型注册// 这种设计允许编译器在不加载算子实现库(Kernel)的情况下// 仅通过原型库就能完成图的校验与推导public:// 1. 定义算子类型标识符// 2. 声明输入端口与其依赖的数据类型// 3. 声明输出端口// 4. 定义算子特有的属性(如 stride, dilation)// 支持设置默认值

#人工智能#安全
基于OpenClaw构建QQ智能机器人系统的全流程技术实现

在人工智能技术高度发展的背景下,将大语言模型(LLM)接入即时通讯工具已成为提升交互效率的关键手段。本文将详细阐述如何利用蓝耘算力平台、腾讯云轻量应用服务器以及OpenClaw开源框架,完成一个具备多模态处理能力的QQ机器人部署。

文章图片
#机器人#数据库
硬件的灵魂:runtime 架构下异步任务调度与资源管理深度解析

如果说深度学习编译器是将模型蓝图翻译成机器指令的“建筑师”,那么就是确保这些指令在 NPU 硬件上被精确、高效执行的“现场总指挥”和“操作系统”。它不关心算子的数学逻辑,只关心资源的分配、任务的调度以及数据的流动。runtime仓库定义了异构计算架构的用户态 API,是上层框架(如 PyTorch、TensorFlow)与底层硬件驱动(Kernel-Mode Driver)之间的关键桥梁。它为开发

#安全#人工智能
基于 KaiwuDB社区版 的高并发车联网海量时序数据存储引擎实战:从行业痛点到全链路部署深度解析

在当今数字化转型的浪潮中,智能网联汽车(Internet of Vehicles, IoV)已成为物联网技术最前沿的试验场。随着 5G 通信技术的普及与车载传感器精度的提升,车辆不再仅仅是交通工具,而是演变成了每时每刻都在产生海量数据的移动计算终端。每一辆行驶在道路上的智能汽车,其内部的 CAN 总线、GPS 定位模块、发动机控制单元(ECU)以及环境感知雷达,都在以毫秒级的频率向云端发送状态数据

文章图片
众核共舞的指挥棒:深度解析 CANN HCCL 集合通信库

为了展示 HCCL 如何抽象通信组与操作,以下代码片段并非用户侧的 Python 脚本,而是 HCCL 底层 C++ 头文件中对于通信域(Communicator)和配置项的结构定义示例。这体现了系统级编程的严谨性。#endif// HCCL 返回码定义,用于精确的错误诊断HCCL_E_PARA = 1, // 参数错误HCCL_E_PTR = 2, // 空指针异常HCCL_E_MEMORY =

#人工智能
CANN算子开发的未知边界:动态Shape支持的设计与实现

我们已经将算子的单核与多核性能优化到了一个非常高的水平。但所有这些优化,都建立在一个重要的前提之上:算子的输入形状(Shape)在编译时是固定的。然而,在真实的AI应用中,尤其是NLP和推荐模型,输入的形状常常是动态变化的(例如,处理不同长度的句子,batch size可变)。

文章图片
#python#开发语言
基于达芬奇架构与CANN软件栈的深度学习模型异构算力迁移全链路解析

在后摩尔定律时代,通用处理器(CPU)的指令集架构(ISA)已难以满足深度神经网络(DNN)对张量(Tensor)并行计算的算力需求。专用领域架构(Domain Specific Architecture, DSA)应运而生,其中以华为昇腾(Ascend)AI处理器为代表的NPU(Neural Processing Unit)通过定制化的Cube与Vector计算单元,显著提升了能效比。然而,硬件

文章图片
#架构#深度学习#人工智能
异构计算的另一极:昇腾CANN中的AI CPU算子开发实战

在昇腾CANN算子开发的旅程中,我们的目光往往聚焦于AI Core(Da Vinci核心)的极致性能——我们学习Tiling、流水线、向量化,旨在榨干其强大的张量计算能力。将AI Core的性能优化技艺与AI CPU的灵活编程能力相结合,你将成为一名能够驾驭整个异构计算平台的、真正的全栈AI系统工程师。它让我们明白,昇腾NPU的强大,不仅在于AI Core的磅礴算力,更在于异构单元之间协同工作的智

文章图片
#人工智能
昇腾NPU适配Apex避坑指南:从编译失败到顺利安装

通过这个指南,从为什么用Apex Patch到安装和问题排查,我们基本掌握了流程。整个过程其实最容易卡在环境依赖版本不匹配和编译时的路径设置上。作为开发者,装好Apex不只是步骤,还能帮你加速AI训练。从原理到实际,试试看。昇腾NPU在兴起,Apex Patch能帮大忙,赶紧克隆仓库上手吧!注明:昇腾PAE案例库对本文写作亦有帮助。

文章图片
#elasticsearch#大数据#搜索引擎
    共 140 条
  • 1
  • 2
  • 3
  • 14
  • 请选择