logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python圣诞特辑:打造一棵会唱歌、会下雪的魔法圣诞树

本书从 DeepSeek 的相关知识讲起,围绕其本地化部署、安全防护,结合 OpenWebUI、Dify 等工具展开深入讲解,并通过多个实战案例,让读者不仅系统学习 DeepSeek 本地化部署的专业知识,还对 AI 在企业场景中的应用有更为深入的理解。当圣诞树绘制完成后,程序会在短短几秒内创建100个粉色的小窗口,每个窗口都写着"圣诞节快乐",它们会从屏幕的各个角落涌现,像是心跳的律动,像是漫天

文章图片
#python#pygame#开发语言
华为CANN 8.0深度评测:CANN在边缘AI场景的落地实践

与竞品相比,CANN的特色在于编译器能自动识别计算图中可融合的算子组合,减少内存访问开销,针对NPU的分层存储结构(L0/L1/DDR),自动安排数据搬运策略,无需手动调优就能获得接近硬件极限的性能。也许你的下一个项目不需要最前沿的Transformer变体,也不需要追求极致的单卡性能,而是需要一个成本可控、供应链稳定、能快速落地的方案。这种简化不仅让新手上手时间从3天缩短到1天,更重要的是,AC

文章图片
#华为#人工智能
华为CANN 8.0深度评测:CANN在边缘AI场景的落地实践

与竞品相比,CANN的特色在于编译器能自动识别计算图中可融合的算子组合,减少内存访问开销,针对NPU的分层存储结构(L0/L1/DDR),自动安排数据搬运策略,无需手动调优就能获得接近硬件极限的性能。也许你的下一个项目不需要最前沿的Transformer变体,也不需要追求极致的单卡性能,而是需要一个成本可控、供应链稳定、能快速落地的方案。这种简化不仅让新手上手时间从3天缩短到1天,更重要的是,AC

文章图片
#华为#人工智能
昇腾实战 | 昇腾 NPU 异构编程与 GEMM 调优核心方法

从异构编程到 GEMM 算子调优,核心逻辑始终围绕 “让软件行为贴合硬件特性” 展开。具体来看,异构编程的核心在于明确 Host 与 Device 的分工边界,而 GEMM 作为核心算子,从按 Cube 单元尺寸分块以适配硬件计算粒度,到通过块布局优化提升内存访问效率,再到用双缓冲实现计算与数据搬运的并行、用 Swizzling 平衡内存带宽压力,每一步优化都是对硬件特性的深度适配。但实践也表明,

文章图片
#华为#人工智能#CANN
昇腾实战 | 昇腾 NPU 异构编程与 GEMM 调优核心方法

从异构编程到 GEMM 算子调优,核心逻辑始终围绕 “让软件行为贴合硬件特性” 展开。具体来看,异构编程的核心在于明确 Host 与 Device 的分工边界,而 GEMM 作为核心算子,从按 Cube 单元尺寸分块以适配硬件计算粒度,到通过块布局优化提升内存访问效率,再到用双缓冲实现计算与数据搬运的并行、用 Swizzling 平衡内存带宽压力,每一步优化都是对硬件特性的深度适配。但实践也表明,

文章图片
#华为#人工智能#CANN
昇腾实战 | 昇腾 NPU 异构编程与 GEMM 调优核心方法

从异构编程到 GEMM 算子调优,核心逻辑始终围绕 “让软件行为贴合硬件特性” 展开。具体来看,异构编程的核心在于明确 Host 与 Device 的分工边界,而 GEMM 作为核心算子,从按 Cube 单元尺寸分块以适配硬件计算粒度,到通过块布局优化提升内存访问效率,再到用双缓冲实现计算与数据搬运的并行、用 Swizzling 平衡内存带宽压力,每一步优化都是对硬件特性的深度适配。但实践也表明,

文章图片
#华为#人工智能#CANN
昇腾实战|算子模板库Catlass与CANN生态适配

Catlass模板库为昇腾NPU提供了高效的开发接口,显著降低了底层硬件编程的复杂度。通过预置优化策略和灵活的配置选项,开发者能够快速实现高性能算子,充分发挥NPU的并行计算能力。测试表明,在典型矩阵乘法任务中,Catlass在保证计算精度的同时,大幅提升了运算效率,为AI模型训练和推理提供了可靠加速。随着异构计算的普及,掌握此类高性能开发工具对开发者至关重要。Catlass的易用性和可扩展性使其

文章图片
#python#开发语言#华为 +1
昇腾实战|算子模板库Catlass与CANN生态适配

Catlass模板库为昇腾NPU提供了高效的开发接口,显著降低了底层硬件编程的复杂度。通过预置优化策略和灵活的配置选项,开发者能够快速实现高性能算子,充分发挥NPU的并行计算能力。测试表明,在典型矩阵乘法任务中,Catlass在保证计算精度的同时,大幅提升了运算效率,为AI模型训练和推理提供了可靠加速。随着异构计算的普及,掌握此类高性能开发工具对开发者至关重要。Catlass的易用性和可扩展性使其

文章图片
#python#开发语言#华为 +1
昇腾实战|算子模板库Catlass与CANN生态适配

Catlass模板库为昇腾NPU提供了高效的开发接口,显著降低了底层硬件编程的复杂度。通过预置优化策略和灵活的配置选项,开发者能够快速实现高性能算子,充分发挥NPU的并行计算能力。测试表明,在典型矩阵乘法任务中,Catlass在保证计算精度的同时,大幅提升了运算效率,为AI模型训练和推理提供了可靠加速。随着异构计算的普及,掌握此类高性能开发工具对开发者至关重要。Catlass的易用性和可扩展性使其

文章图片
#python#开发语言#华为 +1
昇腾实战|算子模板库Catlass与CANN生态适配

Catlass模板库为昇腾NPU提供了高效的开发接口,显著降低了底层硬件编程的复杂度。通过预置优化策略和灵活的配置选项,开发者能够快速实现高性能算子,充分发挥NPU的并行计算能力。测试表明,在典型矩阵乘法任务中,Catlass在保证计算精度的同时,大幅提升了运算效率,为AI模型训练和推理提供了可靠加速。随着异构计算的普及,掌握此类高性能开发工具对开发者至关重要。Catlass的易用性和可扩展性使其

文章图片
#python#开发语言#华为 +1
    共 79 条
  • 1
  • 2
  • 3
  • 8
  • 请选择