logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型稀疏注意力 sparseMode 详解

本文基于CANN开源社区的ops-nn仓库进行技术解读CANN组织链接:https://atomgit.com/cann仓库链接:https://atomgit.com/cann/ops-nn数据格式(format)是用于描述一个多维Tensor的轴的业务语义,表示数据的物理排布格式,如1D、2D、3D、4D、5D等,一般在CNN(Convolutional Neural Networks)类的A

大模型稀疏注意力 sparseMode 详解

本文基于CANN开源社区的ops-nn仓库进行技术解读CANN组织链接:https://atomgit.com/cann仓库链接:https://atomgit.com/cann/ops-nn数据格式(format)是用于描述一个多维Tensor的轴的业务语义,表示数据的物理排布格式,如1D、2D、3D、4D、5D等,一般在CNN(Convolutional Neural Networks)类的A

CANN架构解读:场景应用:边缘推理 · 答疑 · 全面解析 · 语音与音频

本文主题在生产中可落地为端到端部署:以 OM 模型承载推理服务,接入 AIPP 完成图像或文本前处理,通过 ACL 管理设备资源与多流并发,结合容器与 K8s 形成弹性伸缩与资源隔离,在 CI/CD 中纳入性能基线,定期回归并输出报表。

#CANN
CANN架构解读:场景应用:边缘推理 · 答疑 · 全面解析 · 语音与音频

本文主题在生产中可落地为端到端部署:以 OM 模型承载推理服务,接入 AIPP 完成图像或文本前处理,通过 ACL 管理设备资源与多流并发,结合容器与 K8s 形成弹性伸缩与资源隔离,在 CI/CD 中纳入性能基线,定期回归并输出报表。

#CANN
昇腾CANN实战:场景应用:科研与超算 · 指南 · 实战进阶 · 自然语言处理

本文主题在生产中可落地为端到端部署:以 OM 模型承载推理服务,接入 AIPP 完成图像或文本前处理,通过 ACL 管理设备资源与多流并发,结合容器与 K8s 形成弹性伸缩与资源隔离,在 CI/CD 中纳入性能基线,定期回归并输出报表。

#CANN
昇腾CANN实战:场景应用:科研与超算 · 指南 · 实战进阶 · 自然语言处理

本文主题在生产中可落地为端到端部署:以 OM 模型承载推理服务,接入 AIPP 完成图像或文本前处理,通过 ACL 管理设备资源与多流并发,结合容器与 K8s 形成弹性伸缩与资源隔离,在 CI/CD 中纳入性能基线,定期回归并输出报表。

#CANN
昇腾CANN实战:场景应用:科研与超算 · 指南 · 实战进阶 · 自然语言处理

本文主题在生产中可落地为端到端部署:以 OM 模型承载推理服务,接入 AIPP 完成图像或文本前处理,通过 ACL 管理设备资源与多流并发,结合容器与 K8s 形成弹性伸缩与资源隔离,在 CI/CD 中纳入性能基线,定期回归并输出报表。

#CANN
CANN优化手册:场景应用:医疗AI · 案例 · 案例拆解 · 边缘推理

本文主题在生产中可落地为端到端部署:以 OM 模型承载推理服务,接入 AIPP 完成图像或文本前处理,通过 ACL 管理设备资源与多流并发,结合容器与 K8s 形成弹性伸缩与资源隔离,在 CI/CD 中纳入性能基线,定期回归并输出报表。

#CANN
CANN优化手册:场景应用:医疗AI · 案例 · 案例拆解 · 边缘推理

本文主题在生产中可落地为端到端部署:以 OM 模型承载推理服务,接入 AIPP 完成图像或文本前处理,通过 ACL 管理设备资源与多流并发,结合容器与 K8s 形成弹性伸缩与资源隔离,在 CI/CD 中纳入性能基线,定期回归并输出报表。

#CANN
CANN最佳实践:场景应用:智慧城市 · 排障 · 生产就绪 · 推荐系统

本文主题在生产中可落地为端到端部署:以 OM 模型承载推理服务,接入 AIPP 完成图像或文本前处理,通过 ACL 管理设备资源与多流并发,结合容器与 K8s 形成弹性伸缩与资源隔离,在 CI/CD 中纳入性能基线,定期回归并输出报表。

#CANN
    共 430 条
  • 1
  • 2
  • 3
  • 43
  • 请选择