logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CANN ops-nn 算子实现深度:从内存复用、显式分配到复杂算子结构化建模

算子执行管理器(Operator Executor)分析数据流图。一旦某个中间张量(如某次矩阵乘的结果)完成其后续操作,其占用的本地内存空间即被标记为可释放。后续需要新内存的算子可以直接复用这块已被释放的地址空间,避免了额外的内存分配和回收开销。

#网络#linux#大数据
深度揭秘 DeepSeek:AI 新贵与蓝耘智算平台的完美搭档

在当今科技飞速发展的时代,人工智能(Artificial Intelligence,简称 AI)已然成为推动社会进步的核心力量。从智能语音助手到自动驾驶,从医疗诊断到金融风险预测,AI 的应用无处不在,深刻地改变着我们的生活和工作方式。随着 AI 技术的不断演进,各种 AI 模型如雨后春笋般涌现,它们在不同的领域展现出独特的能力。而在这众多的模型中,DeepSeek 以其卓越的性能和独特的优势,成

文章图片
#人工智能
指挥家的权杖:掌控Ascend C多核同步与负载均衡的艺术

我在CANN昇腾C语言领域的探索之旅,充满了持续的顿悟。我学会了并行思考,学会了用Tiling排兵布阵,学会了像大师级铁匠一样融合算子。我曾一度以为,自己已经驯服了多核并行这头猛兽。我的策略很简单,也自认为很有效:将问题分解成相等的几份,每一份指派给NPU众多的AI Core中的一个,然后让它们自由驰骋。对许多问题而言,这套方法效果卓著。Profiler性能分析器上,AI Core矩阵整齐划一地启

文章图片
#c语言#负载均衡#开发语言
Ascend C算子开发心得:告别CPU思维,拥抱Cube核心的并行计算之美

参加2025昇腾CANN训练营,对我而言,不只是一次学习,更是一场思维的“格式化”。作为一名习惯了在CPU上用for循环解决一切问题的开发者,我曾以为AI算子开发不过是换个平台写代码。然而,当我第一个算子的性能数字出来时,我被深深刺痛了——我用着最先进的NPU,却写出了比CPU还慢的代码。这篇心得,就是记录我如何从“CPU思维”的牢笼中挣脱,真正理解并拥抱昇腾Cube核心并行计算之美的过程。

文章图片
#c语言#人工智能#开发语言
深度揭秘 DeepSeek:AI 新贵与蓝耘智算平台的完美搭档

在当今科技飞速发展的时代,人工智能(Artificial Intelligence,简称 AI)已然成为推动社会进步的核心力量。从智能语音助手到自动驾驶,从医疗诊断到金融风险预测,AI 的应用无处不在,深刻地改变着我们的生活和工作方式。随着 AI 技术的不断演进,各种 AI 模型如雨后春笋般涌现,它们在不同的领域展现出独特的能力。而在这众多的模型中,DeepSeek 以其卓越的性能和独特的优势,成

文章图片
#人工智能
深度探寻 DeepSeek 与蓝耘智算平台:人工智能领域的璀璨组合

在当今科技飞速发展的时代,人工智能(AI)无疑是最具影响力和潜力的领域之一。随着 AI 技术的不断演进,各种先进的模型和平台层出不穷,为我们的生活和工作带来了巨大的变革。在这其中,DeepSeek 以其卓越的性能和强大的功能,成为了 AI 领域的一颗耀眼明星。而蓝耘智算平台,则为 DeepSeek 的应用和发展提供了坚实的基础和强大的支持。本文将深入探讨 DeepSeek 的特点以及如何通过蓝耘智

文章图片
#人工智能
深度揭秘 DeepSeek:AI 新贵与蓝耘智算平台的完美搭档

在当今科技飞速发展的时代,人工智能(Artificial Intelligence,简称 AI)已然成为推动社会进步的核心力量。从智能语音助手到自动驾驶,从医疗诊断到金融风险预测,AI 的应用无处不在,深刻地改变着我们的生活和工作方式。随着 AI 技术的不断演进,各种 AI 模型如雨后春笋般涌现,它们在不同的领域展现出独特的能力。而在这众多的模型中,DeepSeek 以其卓越的性能和独特的优势,成

文章图片
#人工智能
深度揭秘 DeepSeek:AI 新贵与蓝耘智算平台的完美搭档

在当今科技飞速发展的时代,人工智能(Artificial Intelligence,简称 AI)已然成为推动社会进步的核心力量。从智能语音助手到自动驾驶,从医疗诊断到金融风险预测,AI 的应用无处不在,深刻地改变着我们的生活和工作方式。随着 AI 技术的不断演进,各种 AI 模型如雨后春笋般涌现,它们在不同的领域展现出独特的能力。而在这众多的模型中,DeepSeek 以其卓越的性能和独特的优势,成

文章图片
#人工智能
深度探索 DeepSeek:解锁 AI 无限可能,携手蓝耘智算平台开启智能之旅

蓝耘 GPU 智算云平台是依托 Kubernetes 搭建的现代化云平台,具备行业领先的灵活基础设施,以及大规模 GPU 算力资源。它为用户提供开放、高性能且性价比高的算力云服务,全方位助力 AI 客户开展模型构建、训练和推理的全业务流程,同时也为教科研客户加速科研创新。平台致力于为科研工作者、工程师以及创新者打造无可比拟的计算解决方案,其运算速度比传统云服务提供商快 35 倍,成本却降低了 30

文章图片
#人工智能
    共 12 条
  • 1
  • 2
  • 请选择