logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CANN ATVC:C向量计算模板库开发指南

ATVC是CANN生态中为AI处理器设计的向量计算模板库,通过三层模板体系(基础计算、领域专用、优化策略)加速NPU算子开发。其核心价值在于:1)开发效率提升60-80%,2)内置硬件优化保障性能,3)模块化设计降低维护成本。关键特性包括自动向量化、动态形状适配和集成性能分析工具。典型开发流程涵盖环境配置、模板调用(如向量加法/点积算子)、性能调优等环节。未来将向AI自动优化、跨平台适配等方向发展

文章图片
#java#人工智能#前端
CANN ATVC:C向量计算模板库开发指南

ATVC是CANN生态中为AI处理器设计的向量计算模板库,通过三层模板体系(基础计算、领域专用、优化策略)加速NPU算子开发。其核心价值在于:1)开发效率提升60-80%,2)内置硬件优化保障性能,3)模块化设计降低维护成本。关键特性包括自动向量化、动态形状适配和集成性能分析工具。典型开发流程涵盖环境配置、模板调用(如向量加法/点积算子)、性能调优等环节。未来将向AI自动优化、跨平台适配等方向发展

文章图片
#java#人工智能#前端
CANN ascend-transformer-boost:Transformer模型终极加速方案

《Ascend-Transformer-Boost:面向Transformer模型的高性能加速库》摘要 Ascend-Transformer-Boost是CANN生态中专为Transformer架构设计的高性能加速库,通过多层次算子融合、FlashAttention优化和内存优化策略三大技术突破,显著提升BERT/GPT等模型的推理和训练性能。核心特性包括:高性能融合算子集合、动态序列长度支持和混

文章图片
#transformer#深度学习#人工智能
CANN driver驱动模块详解:AI芯片的使能引擎

CANN驱动模块是AI处理器的核心软件组件,负责硬件抽象、资源管理和任务调度。它采用分层架构设计,包括硬件初始化、计算资源管理(AICore/AICPU/DVPP)、智能内存分配和功耗管理。任务调度系统支持多种策略和流水线优化,显著提升计算效率。高级特性涵盖多流并行、虚拟化支持和可观测性分析。通过批处理优化、内存复用和异步操作等最佳实践,可充分发挥硬件潜力。该模块作为连接AI框架与硬件芯片的关键桥

文章图片
#人工智能
CANN driver驱动模块详解:AI芯片的使能引擎

CANN驱动模块是AI处理器的核心软件组件,负责硬件抽象、资源管理和任务调度。它采用分层架构设计,包括硬件初始化、计算资源管理(AICore/AICPU/DVPP)、智能内存分配和功耗管理。任务调度系统支持多种策略和流水线优化,显著提升计算效率。高级特性涵盖多流并行、虚拟化支持和可观测性分析。通过批处理优化、内存复用和异步操作等最佳实践,可充分发挥硬件潜力。该模块作为连接AI框架与硬件芯片的关键桥

文章图片
#人工智能
ATVOSS(Ascend C向量算子模板库)入门教程

ATVOSS是Ascend硬件平台上的向量算子模板库,基于AscendC语言开发,旨在简化AI算子开发流程。它提供极简API、高性能保证、模块化设计和完善工具链支持,封装了数据分块、向量化计算、双缓冲等关键技术。通过基础示例展示了向量加法和自定义激活函数的实现,并介绍了动态形状支持、混合精度计算等高级特性。文档还包含最佳实践、调试优化指南及与现有代码集成方法,帮助开发者快速构建高效算子。ATVOS

文章图片
#c语言#开发语言
CANN ascend-boost-comm:算子生态的“连接器“与“放大器“

摘要:ascend-boost-comm是CANN生态中的算子公共平台,采用三层解耦架构实现算子标准化接入与智能调度。平台包含统一接口层、运行时调度层和能力抽象层,支持算子库动态接入、智能匹配及跨库融合优化。主要应用场景包括第三方算子库集成、加速库透明调用和算子能力市场构建,通过M×N连接架构提升算子复用度。部署采用容器化方案,支持算子全生命周期管理。未来将向联邦学习、AI推荐和安全可信等方向演进

文章图片
#java#大数据#开发语言
CANN ascend-boost-comm:算子生态的“连接器“与“放大器“

摘要:ascend-boost-comm是CANN生态中的算子公共平台,采用三层解耦架构实现算子标准化接入与智能调度。平台包含统一接口层、运行时调度层和能力抽象层,支持算子库动态接入、智能匹配及跨库融合优化。主要应用场景包括第三方算子库集成、加速库透明调用和算子能力市场构建,通过M×N连接架构提升算子复用度。部署采用容器化方案,支持算子全生命周期管理。未来将向联邦学习、AI推荐和安全可信等方向演进

文章图片
#java#大数据#开发语言
CANN开源社区参与指南:community项目全面解析

CANN开源社区治理体系详解:该项目是CANN开源社区的治理中枢,包含治理章程、组织架构和贡献流程三大核心模块。社区采用三层治理体系(技术委员会/SIG小组/工作小组)和四阶角色晋升路径(User→Contributor→Committer→Maintainer)。规范化流程包括PR处理机制、SIG参与方式和争议解决机制,并设有导师制度和认证体系支持贡献者成长。目前社区已实现季度35%的贡献者增长

文章图片
#开源
CANN开源社区参与指南:community项目全面解析

CANN开源社区治理体系详解:该项目是CANN开源社区的治理中枢,包含治理章程、组织架构和贡献流程三大核心模块。社区采用三层治理体系(技术委员会/SIG小组/工作小组)和四阶角色晋升路径(User→Contributor→Committer→Maintainer)。规范化流程包括PR处理机制、SIG参与方式和争议解决机制,并设有导师制度和认证体系支持贡献者成长。目前社区已实现季度35%的贡献者增长

文章图片
#开源
    共 85 条
  • 1
  • 2
  • 3
  • 9
  • 请选择