登录社区云,与社区用户共同成长
邀请您加入社区
模型量化压缩技术通过降低参数精度实现存储缩减和计算加速,在昇腾NPU等专用硬件上获得显著性能提升。文章首先介绍量化基础概念,指出昇腾平台通过原生多精度计算架构和智能校准工具解决了低精度计算效率与精度损失的矛盾。随后详细分析主流量化类型及其应用场景,包括W8A8平衡方案、W8A8SC稀疏量化等,并给出典型量化映射算法实现。量化技术可带来4-8倍存储压缩、3-10倍计算加速,已成功应用于云端大模型推理
报名链接:点击报名 QQ交流群:1094426651
今日科技领域关键动态:1️⃣月之暗面开源KimiK2.6模型,在软件工程领域多项基准测试超越GPT-5.4,支持300子Agent并行执行4000步任务;2️⃣英飞凌宣布2027年AURIX车用MCU集成RISC-V架构,行业龙头转向开源架构;3️⃣腾讯云开源CubeSandbox沙箱服务,实现硬件级隔离与亚百毫秒启动;4️⃣工信部支持太空算力研究,我国智能算力规模达1882EFLOPS;5️⃣武
为期四天的CANNBot学 习周-入门课程圆满收官。本次活动以CANNBot算子开发为主题,通过4场连续直播,带领开发者从0到1体验CANN算子开发流程。 本次课程从入门体验到进阶实操,覆盖Ascend C、PyPTO、TileLang-Ascend等多种编程语言,充分展现了CANNBot依托Agent实现的全流程自动化能力,为算子开发带来了显著效率提升与全新开发体验。 Day 1|CA
2026年4月18日,CANN开源社区在北京成功举办本年度首次线下Meetup。本次活动汇聚了来自产业、高校及开源社区等多个领域的技术专家及社区贡献者,围绕行业落地实践、Ascend 950新特性开发与NPU开发工具等议题展开了一场深度技术交流与思想碰撞。 社区联创 | 中石油基于昇腾算子适配的研究与应用 中石油(北京)数智研究院资深算法专家、MCE Maintainer高菲分享了在
一、PyPTO Agent背景 在 Agent 技术日益普及的当下,为了提升开发体验,我们推出了基于智能体平台 CANNBot 与高性能编程框架 PyPTO 的 CANNBot PyPTO Agent。通过将最佳实践固化为 7 个标准化 Skill,并由 4 个专业 Agent 进行协同调度,成功构建了从需求分析到
向量单元也不再满足于规规矩矩的 SIMD,引入了 SIMT 前端,去处理 Gather/Scatter、多线程和控制流这些“难啃的骨头”。这样一来,原本需要反复搬运的一边数据,被固定住了,带宽压力立刻减轻,效率自然上去。换句话说,它不再让数据块在缓存里横冲直撞,而是让它们沿着更聪明的路径转身、回摆、再推进。矩阵遍历不再“一条道走到黑”,而是走到 L2 容量边界就折返,让数据块尽量在 L2 内部就地
当芯片越来越强,程序员为什么反而更难掌控它? 2026年3月,新一代昇腾950系列芯片逐渐浮出水面。 如果把它摊开来看,像不像一张密密麻麻的工业园区图? 32个矩阵运算单元、64个向量处理核心、1.6TB/s的DDR带宽、1728 TFlops的FP4算力。数字很耀眼,硬件很凶猛。可问题也正出在这里:芯片越强,驾驭它的人却未必越轻松。 为什么?因为它不再是一座小作坊,而是
玩转昇腾 CANN:从 Hello World 到向量归一化的 Host–NPU 异构计算实战
10 分钟玩转昇腾 CANN 自定义算子:Abs 算子基于 Notebook 调试全流程
本文介绍了昇腾NPU设备的容器化使用方法,主要包括两种挂载方式:物理挂载模式(需手动指定设备)和Runtime模式(自动挂载)。详细说明了虚拟NPU的创建流程,包括查询模板、创建vNPU、查看信息和删除操作。提供了Docker环境配置指南,包括二进制安装、Runtime配置和启动验证。最后给出了虚拟卡申请、挂载示例和常用管理命令。全文涵盖了从硬件虚拟化到容器集成的完整操作流程,适用于昇腾AI处理器
参会指南+直播预约,干货、福利双丰收 备受期待的 CANN Meetup 北京站,将于本周六(4月18日)正式与大家见面!为了让每一位参会者都能轻松赴约、满载而归,这份超详细参会指南请务必收藏,从签到流程到会场细节,从干货议题到专属福利,一文读懂所有注意事项~ 活动核心信息 ⏰ 签到时间:4月18日(本周六)13:30开始 ⏳ 活动时间:4月18日 14:00 - 18:00 活动地点:北
进入社区互动讨论,获取往期材料,赢取社区好礼~ https://gitcode.com/org/cann/discussions/80
本文详细介绍了如何利用昇腾MindIE平台高效部署Qwen2.5-VL-32B多模态模型,从硬件准备、环境搭建到模型部署和性能调优的全流程实战指南。通过优化配置和实用技巧,显著提升多模态推理效率,适用于电商、教育、医疗等多个领域的AI应用场景。
metrics:label:# 不配置将直接使用内置默认配置 export MS_SERVICE_METRIC_CONFIG_PATH = /path/to/metric_config.yaml具体配置项说明可以参考:https://gitcode.com/Ascend/msserviceprofiler/blob/master/ms_service_metric/README.md[#ms](j
国产算力正在从‘替代’走向‘超越’,从单点突破演变为体系化作战。国产算力实现历史性突破——DeepSeek V4、阿里通义、字节豆包等头部大模型全面完成从CUDA到CANN的全栈迁移,标志着中国AI彻底摆脱外部算力封锁昇腾950PR推理成本降至英伟达1/70——这是国产算力从“可用”走向“好用、规模化”的关键节点,万亿Token级任务的规模化落地正在成为现实半导体涨价潮全面蔓延——从晶圆代工到MC
CANN Meetup本周六在北京举办,干货抢先看。 议题一:中石油基于昇腾算子适配的研究与应用 中石油国产算力适配取得突破性进展,实现科学计算、时序模型、多模态、CV等近20个模型在多领域全面落地应用,深度赋能科研创新及生产运营核心业务。通过持续攻坚显存优化、算子开发、精度对齐等技术难题,积累了扎实的工程化实践经验,为能源行业算力自主创新树立了标杆。 议题二:AI赋能化工工艺流程模拟与仿真 构建
近日,CANN开源社区首个面向垂直行业的Material Chemical Engineering SIG(材料化学工程特别兴趣小组,简称MCE SIG)正式发布两款科学计算算子——LJForceFused分子动力学算子与耗散粒子动力学(DPD)算子。两款算子分别面向微观原子尺度与介观流体尺度,标志着该SIG初步完成多尺度计算布局,为流程工业领域提供了专业开源算子基础设施。 目前两款算子已覆盖催化
昇腾
——昇腾
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net