logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CANN hccl:AIGC 分布式计算的桥梁与性能加速器

CANNhccl仓库所代表的集体通信能力,是 AIGC 巨型模型实现高效分布式训练和推理的关键。通过本文对hcclAPI 在梯度聚合 (AllReduce) 等场景的实践解读,我们了解到如何利用底层通信原语,确保 AIGC 任务在多设备协同工作时,能够达到极致的效率和性能。

#开发语言
CANN/sip:轻量小模型推理的场景化加速工具库与快速落地

sip模型压缩技术权重聚类(4-bit量化)通道剪枝(移除冗余特征图)知识蒸馏(小模型专用训练方法)运行时优化自适应计算调度(根据CPU负载调整并行度)智能缓存预热(提前加载常用模型参数)动态精度切换(根据场景需求调整计算精度)部署便利性单一动态库部署(<500KB)跨平台支持(ARM/x86/RISC-V)无第三方依赖(除标准C库)某智能门锁厂商:将人脸识别模型内存占用从53MB降至16MB工业

文章图片
#服务器#运维
CANN/ops-cv:计算机视觉基础算子的高效工具库

计算机视觉项目中,图像缩放和边缘检测等基础操作若手动实现,不仅耗时且容易因算法差异导致效果不一致。CANN生态中的ops-cv库通过封装常用CV算子,提供统一的图像处理接口,有效降低开发成本。该库涵盖图像缩放、卷积、灰度化等核心操作,本文将从代码架构、核心实现和集成示例三个维度解析其应用价值。/*** 最近邻插值图像缩放* @param src 输入图像数据(RGB格式)* @param src_

#算法
CANN hccl:AIGC 分布式算力协同引擎与高效通信实践

CANNhccl仓库所代表的集体通信能力,是 AIGC 巨型模型实现高效分布式训练和推理的关键。通过本文对hcclAPI 在参数广播等场景的实践解读,我们了解到如何利用底层通信原语,确保 AIGC 任务在多设备协同工作时,能够达到极致的效率和性能。

#算法
CANN Driver:AIGC 算力引擎的底层精粹与资源协同

摘要:本文深入探讨CANNdriver仓库在AIGC场景下的底层运行时优化实践。通过分析driver层提供的设备控制、内存管理、异步任务调度等核心能力,结合图像风格化模型案例,详细演示了如何利用多流并行和事件同步机制优化AIGC推理性能。文章重点剖析了异步数据传输与计算同步的实现方法,并给出基于C++ACLAPI的完整代码示例,展现了driver层在提升AIGC应用吞吐量和降低延迟方面的关键作用。

#数据库
CANN Driver:AIGC 模型底层算力引擎与高效资源管理实践

CANNdriver仓库所代表的底层运行时能力,是 AIGC 模型实现高性能、高效率部署的基石。通过本文对driver层 API 在设备管理、内存分配、异步任务调度和模型执行方面的实践解读,我们了解到如何精细地控制计算资源,从而为 AIGC 应用提供极致的算力支持。

文章图片
#人工智能
CANN ops-math:AIGC 核心运算的高效构建与优化实践

ATTR(degree, Int, 3) // 多项式逼近的阶数解读:这里定义了一个名为的算子,它接受一个输入x,产生一个输出y,并有一个可配置的属性degree,表示多项式逼近的阶数。这体现了ops-math算子自定义的灵活性。CANN 的ops-math仓库为 AIGC 领域的开发者提供了一个强大的工具,能够深入底层,定制和优化核心数学运算。通过实践自定义 Sigmoid 近似函数,我们展示了

#microsoft#开发语言
CANN AMCT:AIGC 模型极致压缩与精度守护的平衡术

CANNamct仓库为 AIGC 开发者提供了一个强大而灵活的模型压缩工具包。它使我们能够在模型庞大、计算复杂的 AIGC 领域中,通过智能量化实现性能突破,交付更轻量、更快速的生成式 AI 应用,同时最大限度地保留模型的创新能力和生成质量。希望本文能为你提供有益的参考,祝你在 AIGC 的广阔天地中,持续创新,成果丰硕!🚀💡。

文章图片
#golang#开发语言#后端
CANN AMCT:AIGC 模型极致压缩与精度守护的平衡术

CANNamct仓库为 AIGC 开发者提供了一个强大而灵活的模型压缩工具包。它使我们能够在模型庞大、计算复杂的 AIGC 领域中,通过智能量化实现性能突破,交付更轻量、更快速的生成式 AI 应用,同时最大限度地保留模型的创新能力和生成质量。希望本文能为你提供有益的参考,祝你在 AIGC 的广阔天地中,持续创新,成果丰硕!🚀💡。

文章图片
#golang#开发语言#后端
CANN hccl:AIGC 分布式训练与推理的关键通信策略

CANNhccl仓库所代表的集体通信能力,是 AIGC 巨型模型实现高效分布式训练和推理的关键。通过本文对hcclAPI 在梯度聚合 (AllReduce) 等场景的实践解读,我们了解到如何利用底层通信原语,确保 AIGC 任务在多设备协同工作时,能够达到极致的效率和性能。

#哈希算法#散列表#算法
    共 38 条
  • 1
  • 2
  • 3
  • 4
  • 请选择