logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CANN runtime 单算子执行接口设计与多框架兼容性实现

大语言模型(LLM)的训练是人工智能领域算力密集、流程复杂的核心工作,从模型架构选择、超参数配置,到硬件资源调度、训练流程编写,每一个环节都需要资深算法工程师和运维工程师的深度参与。传统LLM训练脚本的开发模式,不仅需要开发者熟练掌握PyTorch、TensorFlow等AI框架,还需深入理解底层硬件的调度逻辑,开发周期长、门槛高、可复用性低,成为制约LLM技术规模化落地的重要瓶颈。

文章图片
#CANN
实测看这篇!把 AI 装进远程软件之后,ToDesk 的 ToClaw 到底是不是生产力工具?

在这轮 AI 产品密集上新的阶段,很多工具都在做一件事:把“聊天”做得更像聊天,把“写作”做得更像写作。但真正让职场用户愿意持续打开的软件,往往不是因为它会说,**而是因为它能把一个真实任务从头带到尾**。

文章图片
#人工智能#计算机视觉
群晖NAS使用Audio Station制作本地文件公网地址让音频共享更高效

大家好,今天我要给大家揭秘一个超级实用的小技巧——如何在任何地方都能畅享存储在家中的群晖NAS里的音乐。想象一下,无论你是在出差、旅行还是临时出门办事,都能轻松享受家里的高品质音乐库,是不是感觉超爽?别担心技术难题,跟着我一步步操作,保证让你轻松搞定远程访问!

文章图片
#音视频#linux#服务器 +1
告别手动备份!群晖CloudSync一键同步神器让你的数据存储更安心

在这个信息爆炸的时代,谁不想成为数据界的‘小超人’呢?无论是个人还是企业,面对散落在各个角落的数据,总是让人抓狂。别急,群晖的**Cloud Sync**套件就像你的私人助理,让你轻轻松松搞定一切!想象一下这样的场景:你在出差的路上突然需要家里的某个重要文件;或者你正在办公室加班,急需将项目资料备份到云端。这些看似棘手的问题,在 Cloud Sync 的帮助下变得轻松无比。只需动动手指,数据就能从

文章图片
#linux#服务器#tcp/ip
超便捷语音转文字工具CapsWriter-Offline本地部署与远程使用全流程

今天给大家安利一个绝对能让你工作效率飙升的神器——CapsWriter-Offline。这款工具简直是为懒人量身定做的,只需动动嘴皮子,所有文字输入任务都能轻松搞定!无论是整理会议录音、高效聊天输入,还是处理复杂的文本转换,它都能一招制胜。而且操作简直不要太简单,上手几乎零门槛!接下来就让我们一起探索如何在Windows系统中安装和使用这款神器吧,保证让你的工作效率瞬间提升到新高度!

文章图片
#人工智能#开源#linux
AI助力写作效率翻倍!思源笔记与本地Ollama的高效联动方案

国产化软件笔记思源与本地部署的大语言模型Ollama进行对接。Ollama作为一款高性能的大语言模型,能够为用户提供准确、快速的文本生成服务。但如何实现远程访问和对接,成为了摆在我们面前的一大难题。

文章图片
#人工智能#服务器#linux
CANN pyasc 的 Python 语法到硬件指令的编译流程

在当今数字化业务场景中,网页自动化与智能数据采集已成为提升研发效率、实现业务监控和构建AI训练数据集的关键能力。然而,传统方案如Selenium与Requests的割裂使用,常导致开发复杂度高、维护成本大、执行效率低等问题。开发者迫切需要一个**统一、高效、易用**的自动化工具。

文章图片
#开源#自动化#运维 +2
CANN shmem 与 POSIX 共享内存的性能差异根源分析

在多进程或多设备协同计算场景中,共享内存是实现低延迟、高吞吐数据交换的核心机制。传统 POSIX 共享内存(如shm_openmmap)提供了操作系统级别的通用接口,但在面向 AI 加速器的高性能计算环境中,其通用性往往以牺牲性能为代价。CANN 开源项目中的SHMEM(Shared Memory Library)组件,作为一套专为异构计算优化的多机多卡内存通信库,通过深度集成硬件特性与运行时调度

文章图片
#人工智能#CANN#神经网络 +1
CANN catlass 与 CUTLASS 的设计理念对比及硬件适配差异

CUTLASS是通用 GPU 编程模型的极致优化,依赖强大编译器与硬件一致性;catlass是专用 AI 加速器的白盒化模板库,强调硬件亲和、显式控制与可定制性。对于 CANN 生态开发者,catlass 提供了前所未有的算子开发自由度——从 DMA 调度到指令发射均可干预,从而在特定 shape 下达到 0.98~1.2 倍的标杆性能。而 CUTLASS 则更适合快速原型与跨代 GPU 部署。

文章图片
#ui#AIGC#CANN +1
CANN catlass 如何通过模板元编程实现高性能 GEMM 算子族

CANN catlass 通过精妙的模板元编程设计,将高性能 GEMM 算子的开发从“手写汇编”的黑盒模式,转变为“参数化配置 + 白盒调试”的工程化范式。它不仅是 CANN 生态的性能基石,更是开源社区协同创新的典范——让每一位开发者都能站在巨人的肩膀上,定制属于自己的极致算子。对于追求极致性能的 AI 系统工程师、编译器开发者或 HPC 研究者而言,深入理解 catlass 的设计哲学与实现细

文章图片
#开源#爬虫#架构 +2
    共 36 条
  • 1
  • 2
  • 3
  • 4
  • 请选择