logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Claude Opus 4.7太强了,保姆级使用指南

2026年4月16日,Anthropic正式发布Claude Opus 4.7。Opus 4.7定价与 Opus 4.6持平,但新版分词器可能导致实际输入消耗的token增长0%-35%。另外,由于思考强度也比4.6高,也会耗费更多输出token。所以在实际体验上,Opus 4.7的总体成本会高一些。如何使用 Claude Opus 4.7:Anthropic 新代理编码模型完整指南本指南将详细介

文章图片
#人工智能
Ops-Transformer深入:CANN生态Transformer专用算子库赋能多模态生成效率跃迁

当AIGC多模态生成技术迈入规模化落地阶段,文本生成、图文联动、音视频生成等场景的核心支撑,早已离不开Transformer架构——从LLaVA的图文理解、GPT系列的文本生成,到Stable Diffusion的文本编码,几乎所有主流AIGC模型都以Transformer为核心骨架,其运算效率直接决定了AIGC应用的落地体验与规模化能力。在昇腾CANN生态中,ops-transformer作为T

文章图片
#transformer#深度学习#人工智能 +1
还在手动配 mysql_exporter?用 Shell 脚本 3 分钟一键搞定,省下半小时喝杯咖啡

你有多久没因为"配置监控"这种小事烦躁过?我之前也是:每次新加一台服务器,就要手动下载 mysql_exporter、配置 prometheus.yml、重启 Prometheus、检查端口能不能访问、看看指标有没有出来。要是改个数据库账号密码,那就更痛苦了——每个配置文件都要改一遍,还怕改错。上个月我接手的第一个运维项目,客户有 27 台 MySQL 服务器。我花了一整天才把 prometheu

文章图片
#mysql#adb#android
Ops-CV解读:自定义算子开发与NPU性能调优

ops-cv已覆盖图像预处理、目标检测后处理等通用场景,但在工业质检、特种安防、医疗影像等定制化场景中,通用算子往往无法满足需求:例如工业场景中需要的“缺陷边缘细化”算子、医疗影像中“病灶区域增强”算子,均属于特殊业务逻辑,无法通过现有算子组合实现高效运算。而基于ops-cv开发自定义算子,核心优势在于“硬件原生适配”——无需从零开发硬件对接逻辑,可直接复用ops-cv的内存管理、指令优化框架,让

文章图片
#算法#CANN
从图像预处理到目标检测:Ops-CV 助力 CV 任务在NPU 上高效运行

ops-cv通过精准的张量生命周期管理,复用已释放的内存空间存储新的中间结果,例如在IoU计算时,复用输入框的内存存储计算结果,内存占用减少35%,尤其适合边缘设备的低内存场景。:在某车企的自动驾驶域控制器中,基于ops-cv构建的图像预处理流水线,将摄像头输入的1920×1080图像预处理延迟从20ms降至5ms,结合目标检测模型的优化,整体系统帧率从15FPS提升至30FPS,满足实时感知需求

文章图片
#目标检测#目标跟踪#人工智能 +1
不仅是 FlashAttention:揭秘 CANN ops-transformer 如何重构大模型推理

不仅仅是一个库,它是华为昇腾团队对 Transformer 架构数年研究的心血结晶。它将复杂的系统工程问题,封装成了简单易用的 API。在这个算力为王的时代,谁能更高效地利用硬件,谁就能在 AIGC 的赛道上跑得更远。现在就点击下方链接,探索这个大模型的“极速引擎”吧!

文章图片
#transformer#重构#深度学习 +2
基于CANN的ops-math仓库:AI计算的数学基石

对于有特殊数学运算需求的开发者(如科研团队、企业算法工程师),ops-math仓库提供了灵活的自定义算子开发框架:例如,某科研团队在开展量子机器学习研究时,需要实现一种自定义的量子态演化数学算子,该算子不属于仓库的现有算子。开发者可基于ops-math仓库提供的开发模板,填充量子态演化的运算逻辑,利用仓库的编译工具链,自动适配昇腾NPU的硬件指令,无需手动编写硬件适配代码。同时,借助仓库的自动化验

文章图片
#人工智能#CANN
AIGC 爆发之下,如何榨干 NPU 的每一滴性能?—— 带你了解 CANN ops-nn

AIGC 的竞争,归根结底是效率的竞争。通过 AtomGit 上的 CANN 开源社区,我们不仅能直接使用这些高性能算子,更能通过阅读源码,洞悉高性能计算(HPC)的精髓。如果你想让你的 AI 应用跑得比别人更快,不妨现在就 Clone 下来,从第一行代码开始,重新认识 NPU。

文章图片
#AIGC#CANN
基于 CANN 的 ops-nn 仓库:解锁 AI 算子开发的新范式

在 AI 技术飞速迭代的今天,高效的算子开发与优化是推动模型性能突破的核心引擎。CANN(Compute Architecture for Neural Networks)作为昇腾计算平台的核心基础软件栈,其开源社区中的ops-nn 仓库正是聚焦于神经网络算子开发与优化的技术阵地,为开发者提供了构建高性能 AI 应用的关键工具链。

文章图片
#人工智能#华为#CANN
【极客深读】打破“显存孤岛”:揭秘 CANN SHMEM 如何引爆集群的分布式算力

在 AIGC 大模型时代,“单卡打天下”的日子早已一去不复返。当参数量飙升至千亿级别,如何让成百上千张 NPU 卡像“一个超级大脑”一样协同工作,成为了算力系统的核心挑战。通常我们提到分布式通信,首先想到的是 HCCL(华为集合通信库)。但在某些追求极致微操的细粒度通信场景下,开发者渴望一种更直接、更低延迟的内存互访机制。今天,我们深入 AtomGit 上的 CANN/shmem仓库,解读这个基于

文章图片
#分布式#CANN
    共 141 条
  • 1
  • 2
  • 3
  • 15
  • 请选择