
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
算子执行管理器(Operator Executor)分析数据流图。一旦某个中间张量(如某次矩阵乘的结果)完成其后续操作,其占用的本地内存空间即被标记为可释放。后续需要新内存的算子可以直接复用这块已被释放的地址空间,避免了额外的内存分配和回收开销。
从而实现更极致的推理加速。
在当今科技飞速发展的时代,人工智能(Artificial Intelligence,简称 AI)已然成为推动社会进步的核心力量。从智能语音助手到自动驾驶,从医疗诊断到金融风险预测,AI 的应用无处不在,深刻地改变着我们的生活和工作方式。随着 AI 技术的不断演进,各种 AI 模型如雨后春笋般涌现,它们在不同的领域展现出独特的能力。而在这众多的模型中,DeepSeek 以其卓越的性能和独特的优势,成

我在CANN昇腾C语言领域的探索之旅,充满了持续的顿悟。我学会了并行思考,学会了用Tiling排兵布阵,学会了像大师级铁匠一样融合算子。我曾一度以为,自己已经驯服了多核并行这头猛兽。我的策略很简单,也自认为很有效:将问题分解成相等的几份,每一份指派给NPU众多的AI Core中的一个,然后让它们自由驰骋。对许多问题而言,这套方法效果卓著。Profiler性能分析器上,AI Core矩阵整齐划一地启

参加2025昇腾CANN训练营,对我而言,不只是一次学习,更是一场思维的“格式化”。作为一名习惯了在CPU上用for循环解决一切问题的开发者,我曾以为AI算子开发不过是换个平台写代码。然而,当我第一个算子的性能数字出来时,我被深深刺痛了——我用着最先进的NPU,却写出了比CPU还慢的代码。这篇心得,就是记录我如何从“CPU思维”的牢笼中挣脱,真正理解并拥抱昇腾Cube核心并行计算之美的过程。

在当今科技飞速发展的时代,人工智能(Artificial Intelligence,简称 AI)已然成为推动社会进步的核心力量。从智能语音助手到自动驾驶,从医疗诊断到金融风险预测,AI 的应用无处不在,深刻地改变着我们的生活和工作方式。随着 AI 技术的不断演进,各种 AI 模型如雨后春笋般涌现,它们在不同的领域展现出独特的能力。而在这众多的模型中,DeepSeek 以其卓越的性能和独特的优势,成

在当今科技飞速发展的时代,人工智能(AI)无疑是最具影响力和潜力的领域之一。随着 AI 技术的不断演进,各种先进的模型和平台层出不穷,为我们的生活和工作带来了巨大的变革。在这其中,DeepSeek 以其卓越的性能和强大的功能,成为了 AI 领域的一颗耀眼明星。而蓝耘智算平台,则为 DeepSeek 的应用和发展提供了坚实的基础和强大的支持。本文将深入探讨 DeepSeek 的特点以及如何通过蓝耘智

在当今科技飞速发展的时代,人工智能(Artificial Intelligence,简称 AI)已然成为推动社会进步的核心力量。从智能语音助手到自动驾驶,从医疗诊断到金融风险预测,AI 的应用无处不在,深刻地改变着我们的生活和工作方式。随着 AI 技术的不断演进,各种 AI 模型如雨后春笋般涌现,它们在不同的领域展现出独特的能力。而在这众多的模型中,DeepSeek 以其卓越的性能和独特的优势,成

在当今科技飞速发展的时代,人工智能(Artificial Intelligence,简称 AI)已然成为推动社会进步的核心力量。从智能语音助手到自动驾驶,从医疗诊断到金融风险预测,AI 的应用无处不在,深刻地改变着我们的生活和工作方式。随着 AI 技术的不断演进,各种 AI 模型如雨后春笋般涌现,它们在不同的领域展现出独特的能力。而在这众多的模型中,DeepSeek 以其卓越的性能和独特的优势,成

蓝耘 GPU 智算云平台是依托 Kubernetes 搭建的现代化云平台,具备行业领先的灵活基础设施,以及大规模 GPU 算力资源。它为用户提供开放、高性能且性价比高的算力云服务,全方位助力 AI 客户开展模型构建、训练和推理的全业务流程,同时也为教科研客户加速科研创新。平台致力于为科研工作者、工程师以及创新者打造无可比拟的计算解决方案,其运算速度比传统云服务提供商快 35 倍,成本却降低了 30








