logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

指挥家的权杖:掌控Ascend C多核同步与负载均衡的艺术

我在CANN昇腾C语言领域的探索之旅,充满了持续的顿悟。我学会了并行思考,学会了用Tiling排兵布阵,学会了像大师级铁匠一样融合算子。我曾一度以为,自己已经驯服了多核并行这头猛兽。我的策略很简单,也自认为很有效:将问题分解成相等的几份,每一份指派给NPU众多的AI Core中的一个,然后让它们自由驰骋。对许多问题而言,这套方法效果卓著。Profiler性能分析器上,AI Core矩阵整齐划一地启

文章图片
#c语言#负载均衡#开发语言
Ascend C算子开发心得:告别CPU思维,拥抱Cube核心的并行计算之美

参加2025昇腾CANN训练营,对我而言,不只是一次学习,更是一场思维的“格式化”。作为一名习惯了在CPU上用for循环解决一切问题的开发者,我曾以为AI算子开发不过是换个平台写代码。然而,当我第一个算子的性能数字出来时,我被深深刺痛了——我用着最先进的NPU,却写出了比CPU还慢的代码。这篇心得,就是记录我如何从“CPU思维”的牢笼中挣脱,真正理解并拥抱昇腾Cube核心并行计算之美的过程。

文章图片
#c语言#人工智能#开发语言
深度揭秘 DeepSeek:AI 新贵与蓝耘智算平台的完美搭档

在当今科技飞速发展的时代,人工智能(Artificial Intelligence,简称 AI)已然成为推动社会进步的核心力量。从智能语音助手到自动驾驶,从医疗诊断到金融风险预测,AI 的应用无处不在,深刻地改变着我们的生活和工作方式。随着 AI 技术的不断演进,各种 AI 模型如雨后春笋般涌现,它们在不同的领域展现出独特的能力。而在这众多的模型中,DeepSeek 以其卓越的性能和独特的优势,成

文章图片
#人工智能
深度揭秘 DeepSeek:AI 新贵与蓝耘智算平台的完美搭档

在当今科技飞速发展的时代,人工智能(Artificial Intelligence,简称 AI)已然成为推动社会进步的核心力量。从智能语音助手到自动驾驶,从医疗诊断到金融风险预测,AI 的应用无处不在,深刻地改变着我们的生活和工作方式。随着 AI 技术的不断演进,各种 AI 模型如雨后春笋般涌现,它们在不同的领域展现出独特的能力。而在这众多的模型中,DeepSeek 以其卓越的性能和独特的优势,成

文章图片
#人工智能
深度探寻 DeepSeek 与蓝耘智算平台:人工智能领域的璀璨组合

在当今科技飞速发展的时代,人工智能(AI)无疑是最具影响力和潜力的领域之一。随着 AI 技术的不断演进,各种先进的模型和平台层出不穷,为我们的生活和工作带来了巨大的变革。在这其中,DeepSeek 以其卓越的性能和强大的功能,成为了 AI 领域的一颗耀眼明星。而蓝耘智算平台,则为 DeepSeek 的应用和发展提供了坚实的基础和强大的支持。本文将深入探讨 DeepSeek 的特点以及如何通过蓝耘智

文章图片
#人工智能
深度揭秘 DeepSeek:AI 新贵与蓝耘智算平台的完美搭档

在当今科技飞速发展的时代,人工智能(Artificial Intelligence,简称 AI)已然成为推动社会进步的核心力量。从智能语音助手到自动驾驶,从医疗诊断到金融风险预测,AI 的应用无处不在,深刻地改变着我们的生活和工作方式。随着 AI 技术的不断演进,各种 AI 模型如雨后春笋般涌现,它们在不同的领域展现出独特的能力。而在这众多的模型中,DeepSeek 以其卓越的性能和独特的优势,成

文章图片
#人工智能
深度揭秘 DeepSeek:AI 新贵与蓝耘智算平台的完美搭档

在当今科技飞速发展的时代,人工智能(Artificial Intelligence,简称 AI)已然成为推动社会进步的核心力量。从智能语音助手到自动驾驶,从医疗诊断到金融风险预测,AI 的应用无处不在,深刻地改变着我们的生活和工作方式。随着 AI 技术的不断演进,各种 AI 模型如雨后春笋般涌现,它们在不同的领域展现出独特的能力。而在这众多的模型中,DeepSeek 以其卓越的性能和独特的优势,成

文章图片
#人工智能
深度探索 DeepSeek:解锁 AI 无限可能,携手蓝耘智算平台开启智能之旅

蓝耘 GPU 智算云平台是依托 Kubernetes 搭建的现代化云平台,具备行业领先的灵活基础设施,以及大规模 GPU 算力资源。它为用户提供开放、高性能且性价比高的算力云服务,全方位助力 AI 客户开展模型构建、训练和推理的全业务流程,同时也为教科研客户加速科研创新。平台致力于为科研工作者、工程师以及创新者打造无可比拟的计算解决方案,其运算速度比传统云服务提供商快 35 倍,成本却降低了 30

文章图片
#人工智能
【深入探索智谱CogVideoX-2b:轻松生成6秒精彩视频的完整指南】

目录一、CogVideoX 的发展历程二、 创建CogVideoX 实践流程三、 环境配置与依赖安装五、 模型运行六、使用 Web 界面生成视频 一、CogVideoX 的发展历程 CogVideoX 的诞生标志着视频生成技术的又一次突破。 以往的技术在追求效率和质量时常常难以两全,但 CogVideoX 通过其 3D 变分自编码器技术,将视频数据压缩至原始数据的 2%,大大减少了计算资源的消耗,

探索智谱CogVideoX-2b的无限可能:6秒视频生成的非凡体验

目录一、3D变分自编码器与3D RoPE技术的突破二、流畅的视频过渡与复杂的输入支持三、社区的支持与未来的前景 8月6日,智谱 AI 宣布了一个振奋人心的消息:他们开源了全新的视频生成模型 CogVideoX,给视频创作带来了全新的机遇。 一、3D变分自编码器与3D RoPE技术的突破 作为一名开发者,我在最近才开始接触 CogVideoX,尽管略显迟到,但使用后的体验让我感到十分惊艳。该模型目前

到底了