
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
TritonInferenceServer的GEBackend实现了CANN优化模型与主流推理框架的无缝对接。该组件采用三层架构设计,支持跨框架模型集成、高并发调度和性能无损传输,可将PyTorch/TensorFlow等框架模型经CANN优化后统一部署。GEBackend提供模型管理、动态批处理和多流并行等功能,通过标准流程实现OM模型加载和推理服务部署。典型应用包括云端多模型服务、高并发API
本文深入解析NPU驱动层的技术架构与核心功能。驱动层采用三层架构设计(用户态接口层-核心服务层-硬件抽象层),具备高效资源调度、低延迟指令执行和稳定硬件控制等核心能力。详细阐述了设备管理、内存管理、指令执行等核心模块的工作原理,并介绍了指令批处理、DMA传输优化等关键技术。该驱动层为AI训练、科学计算等场景提供底层支撑,能有效提升NPU硬件资源利用率,保障系统稳定性,是NPU算力发挥的关键使能组件
摘要:CANN生态推出的cann-recipes-train训练加速指南针对大模型训练面临的高成本、长周期等挑战,提供了一套完整的工程化解决方案。该指南构建了五层实践体系,涵盖环境配置、模型适配、并行策略、优化调优和稳定性保障,通过混合并行、内存优化等技术组合,可将训练吞吐量提升2-5倍,周期缩短30%-60%。实践案例显示,GPT-3175B模型通过混合并行训练方案,实现了单卡内存降低46%、训
本文介绍了CANN生态中的opbase算子基础框架,该框架通过标准化开发规范解决了NPU算子开发中的效率低、兼容性差和性能不稳定等问题。opbase采用三层架构设计(接口抽象层、核心框架层、硬件适配层),提供全生命周期管理、自动校验和内存管理等核心功能,显著降低开发门槛。文章通过矩阵乘法算子的代码示例展示了框架的实际应用,并阐述了其数据布局适配、内存复用等优化策略。该框架适用于通用算子开发、领域专
本文介绍了CANN生态中的ai-manufacturing工业制造AI适配工具,该工具针对智能制造场景中的复杂环境、实时性要求和设备资源限制等问题,提供专业优化方案。文章详细解析了其三层架构设计(数据适配层、AI优化层、部署层)和五大核心技术优势,包括工业数据预处理、模型加速、环境鲁棒性、设备协同和工业协议兼容。通过产品缺陷检测的代码示例,展示了从模型优化到边缘部署的全流程实现。该工具在提升生产质
ai-agriculture 农业 AI 适配工具通过农业场景深度适配、模型轻量化、低功耗推理等核心技术,解决了智慧农业 AI 应用的落地瓶颈,成为智慧农业的精准算力引擎。其场景专用性强、低耗高效、鲁棒性优的特点,使其能够适配病虫害识别、长势评估、墒情监测等多种农业场景,推动智慧农业技术的产业化落地。
hixl 高级索引库通过深度的算法优化与硬件适配,为 NPU 平台提供了高效、灵活的复杂索引操作支持,解决了传统索引实现效率低、内存占用高的痛点。其丰富的索引类型覆盖、强生态兼容性与极简的调用接口,使其成为 AI 开发中数据处理环节的核心工具。
摘要:ai-transportation是一款面向智能交通场景的AI适配工具,通过三层架构设计(数据适配层、AI优化层、异构部署层)实现交通场景的实时响应与多端协同。该工具具备交通数据实时预处理、专用AI模型加速(推理速度提升3-5倍)、多设备协同调度等核心优势,可支持车辆检测、违章识别、交通流量预测等典型应用。代码实践展示了其在路侧车辆检测与流量统计中的高效应用,能实现5ms内的低延迟推理。该工
ai-medical 医疗 AI 适配工具通过医疗场景深度适配、模型高精度优化、安全合规保障等核心技术,解决了智慧医疗 AI 应用的落地瓶颈,成为智慧医疗的精准算力引擎。其高精准、高安全、低延迟的特点,使其能够适配影像诊断、疾病预测、移动监测等多种医疗场景,推动智慧医疗技术的产业化落地。
摘要:ai-environment是一款专为环保场景优化的AI适配工具,通过三层架构设计(数据适配层、AI优化层、边缘云部署层)解决环保AI应用的实时性与算力瓶颈。该工具提供环保数据预处理加速、专用AI模型优化、低延迟推理和边缘云协同等核心功能,显著提升环保监测精度和治理效率。典型应用场景包括空气质量监测、水质污染监测和噪声治理等,能实现毫秒级延迟推理,功耗降低30%-50%。通过环保数据与AI模







