鸽芷咕个人主页

@qq_57761637

鸽芷咕

2023-03-13 22:10:15 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

CANN runtime 中媒体数据预处理流水线与异步执行机制详解

随着人工智能技术的快速发展，大规模生成式AI模型（AIGC）在带来强大能力的同时，也面临着严峻的部署挑战。模型压缩技术成为解决这一问题的关键，其中量化作为最有效的压缩手段之一，正逐渐从传统的手动调优向智能化、自动化方向发展。本文将基于华为昇腾社区的 **AMCT（Ascend Model Compression Toolkit）** 仓库，深入解析智能量化策略生成的技术原理与实践应用。

#AIGC #CANN

CANN runtime 中媒体数据预处理流水线与异步执行机制详解

#AIGC #CANN

CANN runtime 中媒体数据预处理流水线与异步执行机制详解

#AIGC #CANN

CANN driver 稳定性保障机制：超时检测、错误恢复与日志追踪

CANN driver 通过精细化的超时检测、分级的错误恢复策略以及全链路的日志追踪体系，构建了一个坚实可靠的底层支撑。这三大机制相互协同，形成了一个闭环的稳定性保障网络：超时检测是“哨兵”，错误恢复是“医生”，而日志追踪则是“病历”。未来，随着 CANN 生态的演进，driver 的稳定性机制有望进一步智能化，例如引入基于历史数据的异常预测、更细粒度的资源隔离以限制故障爆炸半径等。为上层 AI

#AIGC #transformer #深度学习 +1

CANN driver 稳定性保障机制：超时检测、错误恢复与日志追踪

#AIGC #transformer #深度学习 +1

CANN driver 与上层 runtime 的通信协议与命令队列设计

控制与数据分离、用户态零拷贝、无锁队列、硬件加速同步。通过 ioctl 传递控制命令，通过 mmap 共享命令/事件队列，再辅以 Doorbell 触发机制，构建了一条低延迟、高吞吐的任务提交通路。其命令队列的无锁环形缓冲区设计、多流隔离策略以及对容器化环境的支持，不仅满足了当前大模型训练与推理的需求，也为未来更复杂的 AI 工作负载提供了坚实基础。随着 CANN 生态的持续开源，driver 模

#开源 #CANN

CANN driver 与上层 runtime 的通信协议与命令队列设计

#开源 #CANN

CANN driver 对硬件中断、DMA 与计算单元的底层控制逻辑

CANN driver 仓库通过精心设计的 HAL 层，实现了对硬件中断、DMA 引擎与计算单元的精细化控制。从中断注册与快速响应，到高效 DMA 描述符管理，再到基于 SQ/CQ 模型的任务调度与多租户隔离，每一层都体现了对高性能与高可靠性的追求。随着容器共享、版本兼容性等新特性的加入，driver 正逐步成为支撑大规模 AI 基础设施的坚实底座。🔗相关链接CANN 组织主页：https://

#python #自动化 #microsoft +1

CANN driver 对硬件中断、DMA 与计算单元的底层控制逻辑

#python #自动化 #microsoft +1

CANN driver 中设备资源调度器与多进程共享机制实现

在现代人工智能基础设施中，计算设备的高效利用是核心诉求。单个高性能AI加速器往往需要同时服务于多个用户、多个进程甚至多个容器，这就对底层驱动提出了严峻挑战：如何在保障隔离性与安全性的前提下，实现计算、内存、通信等硬件资源的**公平、高效、低开销**共享？CANN（Compute Architecture for Neural Networks）的 **driver 仓库**（截至2026年初的最新

#开源 #前端 #自动化 +1

共 93 条

请选择