logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

还在手动配 mysql_exporter?用 Shell 脚本 3 分钟一键搞定,省下半小时喝杯咖啡

你有多久没因为"配置监控"这种小事烦躁过?我之前也是:每次新加一台服务器,就要手动下载 mysql_exporter、配置 prometheus.yml、重启 Prometheus、检查端口能不能访问、看看指标有没有出来。要是改个数据库账号密码,那就更痛苦了——每个配置文件都要改一遍,还怕改错。上个月我接手的第一个运维项目,客户有 27 台 MySQL 服务器。我花了一整天才把 prometheu

文章图片
#mysql#adb#android
Ops-CV库介绍:赋能AIGC多模态视觉生成的加速利器

Ops-CV是昇腾CANN生态专属的视觉算子库,核心定位是为视觉处理任务提供高效、轻量化的昇腾NPU原生加速能力,其不仅覆盖传统计算机视觉全流程,更深度适配当前AIGC多模态生成场景(图像生成、图文联动生成、AIGC内容优化等),成为连接AIGC模型与昇腾硬件的核心桥梁,解决AIGC视觉生成中“耗时高、适配难、算力利用率低”的核心痛点,助力AIGC多模态应用快速落地。

文章图片
#AIGC#CANN
AIGC 的隐形基石:从 ops-math 开始掌控算力

在 AIGC(生成式人工智能)的宏大叙事中,我们往往沉迷于 Transformer 的 Attention 机制或 Diffusion 的去噪过程。但如果剥开这些复杂架构的外衣,你会发现,驱动大模型运转的每一行代码,最终都回到了最基础的数学运算。如果说ops-nn是构建大模型的“预制板”,那么ops-math就是粘合一切的“水泥”和“砖块”。今天,我们深入解读 AtomGit 上的仓库。这不仅是一

文章图片
#AIGC#CANN
Ops-CV解读:自定义算子开发与NPU性能调优

ops-cv已覆盖图像预处理、目标检测后处理等通用场景,但在工业质检、特种安防、医疗影像等定制化场景中,通用算子往往无法满足需求:例如工业场景中需要的“缺陷边缘细化”算子、医疗影像中“病灶区域增强”算子,均属于特殊业务逻辑,无法通过现有算子组合实现高效运算。而基于ops-cv开发自定义算子,核心优势在于“硬件原生适配”——无需从零开发硬件对接逻辑,可直接复用ops-cv的内存管理、指令优化框架,让

文章图片
#算法#CANN
从图像预处理到目标检测:Ops-CV 助力 CV 任务在NPU 上高效运行

ops-cv通过精准的张量生命周期管理,复用已释放的内存空间存储新的中间结果,例如在IoU计算时,复用输入框的内存存储计算结果,内存占用减少35%,尤其适合边缘设备的低内存场景。:在某车企的自动驾驶域控制器中,基于ops-cv构建的图像预处理流水线,将摄像头输入的1920×1080图像预处理延迟从20ms降至5ms,结合目标检测模型的优化,整体系统帧率从15FPS提升至30FPS,满足实时感知需求

文章图片
#目标检测#目标跟踪#人工智能 +1
不仅是 FlashAttention:揭秘 CANN ops-transformer 如何重构大模型推理

不仅仅是一个库,它是华为昇腾团队对 Transformer 架构数年研究的心血结晶。它将复杂的系统工程问题,封装成了简单易用的 API。在这个算力为王的时代,谁能更高效地利用硬件,谁就能在 AIGC 的赛道上跑得更远。现在就点击下方链接,探索这个大模型的“极速引擎”吧!

文章图片
#transformer#重构#深度学习 +2
基于CANN的ops-math仓库:AI计算的数学基石

对于有特殊数学运算需求的开发者(如科研团队、企业算法工程师),ops-math仓库提供了灵活的自定义算子开发框架:例如,某科研团队在开展量子机器学习研究时,需要实现一种自定义的量子态演化数学算子,该算子不属于仓库的现有算子。开发者可基于ops-math仓库提供的开发模板,填充量子态演化的运算逻辑,利用仓库的编译工具链,自动适配昇腾NPU的硬件指令,无需手动编写硬件适配代码。同时,借助仓库的自动化验

文章图片
#人工智能#CANN
AIGC 爆发之下,如何榨干 NPU 的每一滴性能?—— 带你了解 CANN ops-nn

AIGC 的竞争,归根结底是效率的竞争。通过 AtomGit 上的 CANN 开源社区,我们不仅能直接使用这些高性能算子,更能通过阅读源码,洞悉高性能计算(HPC)的精髓。如果你想让你的 AI 应用跑得比别人更快,不妨现在就 Clone 下来,从第一行代码开始,重新认识 NPU。

文章图片
#AIGC#CANN
基于 CANN 的 ops-nn 仓库:解锁 AI 算子开发的新范式

在 AI 技术飞速迭代的今天,高效的算子开发与优化是推动模型性能突破的核心引擎。CANN(Compute Architecture for Neural Networks)作为昇腾计算平台的核心基础软件栈,其开源社区中的ops-nn 仓库正是聚焦于神经网络算子开发与优化的技术阵地,为开发者提供了构建高性能 AI 应用的关键工具链。

文章图片
#人工智能#华为#CANN
【极客深读】打破“显存孤岛”:揭秘 CANN SHMEM 如何引爆集群的分布式算力

在 AIGC 大模型时代,“单卡打天下”的日子早已一去不复返。当参数量飙升至千亿级别,如何让成百上千张 NPU 卡像“一个超级大脑”一样协同工作,成为了算力系统的核心挑战。通常我们提到分布式通信,首先想到的是 HCCL(华为集合通信库)。但在某些追求极致微操的细粒度通信场景下,开发者渴望一种更直接、更低延迟的内存互访机制。今天,我们深入 AtomGit 上的 CANN/shmem仓库,解读这个基于

文章图片
#分布式#CANN
    共 141 条
  • 1
  • 2
  • 3
  • 15
  • 请选择