
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
金仓数据库针对DISTINCT查询进行了两层优化:首先将DISTINCT改写为GROUP BY以复用成熟的优化路径,包括键值消除和并行计算;其次在目标列被常值条件完全固定时,将DISTINCT替换为LIMIT 1,实现找到第一条匹配记录即停止扫描的极致优化。实测显示,该优化使查询性能提升最高达1000倍,特别适用于高并发场景下的性能瓶颈问题。用户可通过EXPLAIN验证优化效果,并根据场景特点选择

金仓数据库V9R4C19版本针对CTE和子查询性能问题推出"基于代价的连接条件下推"优化技术。该技术通过两层判断机制:首先进行语义等价性分析确保改写安全,再通过代价模型评估性能收益。实测显示优化后查询性能提升最高达4700倍,解决了封装业务逻辑导致的中间结果集过大问题。相比同类产品DM数据库不支持此优化,金仓实现了自动语义分析和代价评估,无需开发者手动改写SQL。这项技术特别适

状态机驱动的执行流,初始化的握手、强制首帧唤醒破除黑屏,到多模态业务代理,再到优雅的资源销毁——这不仅是一套代码实现,更是我对具身智能如何赋能零售终端的一份完整答卷。

随着人工智能计算需求的快速增长,硬件与软件的高效协同成为提升AI性能的关键。华为昇腾AI处理器(Ascend AI Processor)通过CANN(Compute Architecture for Neural Networks)框架,为开发者提供了高性能、可扩展的算子开发能力。在本文中,我们将深入解析昇腾AI Core的抽象硬件架构,并探讨算子开发中如何利用这些硬件特性实现高效计算。

随着AI计算需求的爆炸式增长,算子性能优化成为神经网络推理和训练中的关键环节。华为昇腾(Ascend)平台的CANN(Compute Architecture for Neural Networks)为开发者提供了丰富的算子开发框架,其中静态Tensor编程范式因其低运行时开销和灵活性而备受关注。本文将深入解析静态Tensor编程的设计理念、内存管理策略、同步控制机制及流水优化方法,帮助开发者掌握

随着人工智能算力的不断提升,算子作为AI模型计算的最小单元,其高效开发和优化显得尤为关键。华为Ascend平台的CANN(Compute Architecture for Neural Networks)为开发者提供了完善的算子编程框架,使得在Ascend AI处理器上实现高性能算子成为可能。本文将深入解析CANN算子开发的编程接口、基础与高阶API、Host端Tiling机制及调测手段,帮助开发

随着AI算力需求的不断增长,如何高效利用华为Ascend处理器的多核计算能力,成为算子开发的关键技术点。在CANN(Compute Architecture for Neural Networks)框架下,算子开发不仅关注功能实现,更强调性能优化与多核协作。本文将以一个典型的Add算子为例,深入解析在Ascend C方式下,多核Tiling算子开发的设计思路、实现流程及运行验证。

本文系统介绍了华为Ascend CANN平台的算子开发核心技术——核函数的定义与调用方法。详细解析了核函数的特殊语法要求(__global__和__aicore__修饰)、参数规范(__gm__指针修饰)以及异步调用机制(<<<...>>>语法)。同时阐述了执行配置参数blockDim的设置规则和模板核函数的使用技巧。文章还介绍了2025年昇腾CANN训练营的系

2025年昇腾CANN训练营第二季,基于CANN开源开放全场景,推出0基础入门系列、码力全开特辑、开发者案例等专题课程,助力不同阶段开发者快速提升算子开发技能。获得Ascend C算子中级认证,即可领取精美证书,完成社区任务更有机会赢取华为手机,平板、开发板等大奖。Ascend C算子分析与设计;核函数的多核并行与流水线实现;Host端调用及结果验证。理解多核并行、数据切块(Tiling)以及流水

在AI算子开发中,性能优化与硬件利用率是核心关注点。华为昇腾(Ascend)平台的CANN(Compute Architecture for Neural Networks)提供了一套高效的算子编程框架,使开发者能够充分发挥NPU的计算能力。本文将从算子设计、Tiling策略、核函数实现到临时内存管理等方面,对华为CANN算子开发进行深入解析,并结合矢量算子和bfloat16数据类型的实现案例,为









