logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【昇腾/AscendC开发】AscendC DataCopyPad 写出溢出 Bug 详解

要点说明AscendC DMA burst 最小 32B的lenBurst参数必须是 32 的倍数UB→GM 方向无 padding 控制不像 GM→UB 有,UB→GM 只有 3 参数版本溢出只影响空段有数据的段会被后续写出覆盖回来,但空段不会被写 → 残留垃圾feat_dim 最好是 8 的倍数,完美对齐,从根本上避免溢出先测小维度如果我们只测 feat_dim=128,永远不会发现这个 bu

#bug#昇腾#华为
【昇腾/AscendC开发】AscendC DataCopyPad 写出溢出 Bug 详解

要点说明AscendC DMA burst 最小 32B的lenBurst参数必须是 32 的倍数UB→GM 方向无 padding 控制不像 GM→UB 有,UB→GM 只有 3 参数版本溢出只影响空段有数据的段会被后续写出覆盖回来,但空段不会被写 → 残留垃圾feat_dim 最好是 8 的倍数,完美对齐,从根本上避免溢出先测小维度如果我们只测 feat_dim=128,永远不会发现这个 bu

#bug#昇腾#华为
想随时随地做点自己的事?创建一台VSCode登录的云电脑

Agent时代,作为高生产力的LLM已经基本在云上,这也意味着普通人目前想享受最前沿的AI的话,无法再像以前那样,搞一张消费级的3090就可以。但同时意味着对本地硬件的要求降低,只要一台能联网的电脑,支付token费用就可以。因此,一台最小配置的云电脑就可以完成很多事,至于用来做什么,留待后续探索😎。

#vscode#人工智能
计算机视觉及深度学习岗位应聘问题汇总

本文旨在收集在面试过程中问到的,以及从网上收集到的有价值的问题,目的是为了从问题出发主动整合知识,在校招有限的时间内抓住重点,避免漫无目的地看书复习。K-means的算法流程?与KNN的区别?K-means的基本算法流程:1. 初始化k个聚类中心c1,c2,...,ckc1,c2,...,ckc_1,c_2,...,c_k2. 对于每个样本xixix_i和每个聚类中心cjcjc_j...

如何使用Porcupine做一个安卓端语音唤醒demo

Porcupine 是一个高精度、轻量级的唤醒词引擎,能够构建始终在线的语音启用应用程序。使用在真实环境中训练的深度神经网络。紧凑且计算高效,适用于物联网(IoT)。跨平台支持:Arm Cortex-M、STM32、Arduino 和 i.MX RTAndroid 和 iOSChrome、Safari、Firefox 和 EdgeLinux(x86_64)、macOS(x86_64、arm64)和

#语音识别
简单实用的huggingface模型python下载方法

huggingface已经是当前广泛使用的模型平台,很多开源模型都存放在huggingface。指定模型保存的目录。

#人工智能
到底了