logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

# CANN实战:30分钟用昇腾芯片部署ResNet50,推理速度提升2.1倍(附全流程避坑指南)

CANN实战:30分钟用昇腾芯片部署ResNet50,推理速度提升2.1倍(附全流程避坑指南)

#人工智能#python#beautifulsoup +1
CANN深度优化:5个被忽略的“黑科技”,让BERT推理吞吐暴涨3.8倍

通过这5个被官方文档弱化的技巧,BERT推理吞吐从120提升至456 QPS。记住:✅ 不要盲目信任默认配置(fusion_switch_file是性能开关)✅ Profiling是调优的起点(没有数据的优化都是猜)✅ 混合精度需分层设计(关键层保留FP16)报名链接。

#人工智能#python#beautifulsoup +2
Ascend C算子开发实战:从零编写高性能AI核心

Ascend C算子开发虽然有一定的学习曲线,但掌握后能够为AI应用带来显著的性能提升。随着AI模型复杂度的不断提升,框架内置算子往往无法满足特定场景的性能需求。自定义算子能够让开发者针对具体硬件特性进行深度优化,充分发挥昇腾AI处理器的计算潜力。以简单的向量加法为例,虽然框架已提供基础实现,但在实际业务中,我们经常需要处理特殊的数据布局、混合精度计算或融合操作,这些都离不开自定义算子开发。在AI

#人工智能#python#beautifulsoup +2
CANN深度优化:5个被忽略的“黑科技”,让BERT推理吞吐暴涨3.8倍

通过这5个被官方文档弱化的技巧,BERT推理吞吐从120提升至456 QPS。记住:✅ 不要盲目信任默认配置(fusion_switch_file是性能开关)✅ Profiling是调优的起点(没有数据的优化都是猜)✅ 混合精度需分层设计(关键层保留FP16)报名链接。

#人工智能#python#beautifulsoup +2
CANN 深度解析(一)】CANN 架构概述及其在 AI 计算中的核心地位

华为推出的 CANN(Compute Architecture for Neural Networks)框架,作为昇腾 AI 处理器的配套软件,正逐渐成为推动 AI 技术进步的重要力量。它通过多层次的抽象和优化,充分利用昇腾处理器的硬件特性,为用户提供了一个高效、易用的 AI 开发平台。通过对其架构和功能的深入理解,开发者可以更好地利用这一强大的工具,推动 AI 技术的创新和应用。高性能:通过对硬

#人工智能#beautifulsoup#matplotlib +2
深入理解CANN架构:从底层算力到AI应用的桥梁

应用层 (App) | + | 框架层 (Framework) | ← TensorFlow / PyTorch / MindSpore + | API层 (ACL) | ← AscendCL 编程接口 +……CANN不仅是昇腾的软件底座,更是中国构建自主AI生态的关键一步。| 算子开发方式 | TBE(Tensor Boost Engine)+ AICPU | CUDA Kernel 手写 |。

#人工智能#python#beautifulsoup +2
# CANN实战:30分钟用昇腾芯片部署ResNet50,推理速度提升2.1倍(附全流程避坑指南)

CANN实战:30分钟用昇腾芯片部署ResNet50,推理速度提升2.1倍(附全流程避坑指南)

#人工智能#python#beautifulsoup +1
# CANN实战:30分钟用昇腾芯片部署ResNet50,推理速度提升2.1倍(附全流程避坑指南)

CANN实战:30分钟用昇腾芯片部署ResNet50,推理速度提升2.1倍(附全流程避坑指南)

#人工智能#python#beautifulsoup +1
Ascend C算子开发实战:从零编写高性能AI核心

Ascend C算子开发虽然有一定的学习曲线,但掌握后能够为AI应用带来显著的性能提升。随着AI模型复杂度的不断提升,框架内置算子往往无法满足特定场景的性能需求。自定义算子能够让开发者针对具体硬件特性进行深度优化,充分发挥昇腾AI处理器的计算潜力。以简单的向量加法为例,虽然框架已提供基础实现,但在实际业务中,我们经常需要处理特殊的数据布局、混合精度计算或融合操作,这些都离不开自定义算子开发。在AI

#人工智能#python#beautifulsoup +2
鸿蒙推荐.

Web📌:两者不是替代关系,而是。鸿蒙擅长移动与 IoT 端,Electron 擅长桌面端。

#html
    共 14 条
  • 1
  • 2
  • 请选择