logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

linux命令生成filelist

工程中,编译文件时,经常采用filelist列出所有需要编译的文件及路径。文件少的时候,可以直接手写/xx/xxx/a.c但是文件多了,手写效率低,易错。采用命令:(1)find-name “*.v” > filelist.f会将当前目录下及子目录中所有.v的文件及路径写到文件filelist.f中。(2)finddir -name “*.v” > filelist.f其中,dir

AI芯片:华为Ascend(昇腾)910结构分析

前几天,华为发布了最新的AI芯片,号称目前全球最强,算力吊打谷歌TPU3和英伟达Tesla V100。这么震撼人心,必须挺一波!!华为牛逼!!(这句5毛)下面来具体分析一下。一、昇腾910的整体结构我去华为官网查了一下,然后就得到这么一点信息:(之后截图补上,这是地址:https://e.huawei.com/cn/products/cloud-computing-dc/atlas/...

AI芯片:寒武纪Cambricon-X结构分析

五、Cambricon-XCambricon-X是针对稀疏系数的矩阵计算架构。深鉴科技的韩松等人的研究发现,可以将传统的深度学习网络模型的许多权重系数去掉,甚至能去掉90%以上,而并不影响模型的计算精度。如下图所示。目前的深度学习模型的权重系数太多,造成需要的乘法计算非常多,计算时间长,速度慢。相信,未来的模型会更加复杂,需要的计算更多,时间更久。未来把模型进行系数删减,就...

AI芯片:华为昇腾(ASCEND)310结构分析

华为的麒麟SOC中使用的是寒武纪的AI芯片模块。但是,华为自己也推出了自有的AI芯片架构。本文根据华为公布的信息,简单分析下其结构。所有信息都来自互联网,来自华为的官方信息。感谢华为的分享!!首先看看,华为发布的一张海报,如下图所示。整体采用华为自研的达芬奇架构,采用高性能的3D Cube计算引擎。因为兴趣及工作领域的因素,我更关注其芯片内部的AI 卷积核的设计。从海报中能够看出...

AI芯片:华为昇腾(ASCEND)310结构分析

华为的麒麟SOC中使用的是寒武纪的AI芯片模块。但是,华为自己也推出了自有的AI芯片架构。本文根据华为公布的信息,简单分析下其结构。所有信息都来自互联网,来自华为的官方信息。感谢华为的分享!!首先看看,华为发布的一张海报,如下图所示。整体采用华为自研的达芬奇架构,采用高性能的3D Cube计算引擎。因为兴趣及工作领域的因素,我更关注其芯片内部的AI 卷积核的设计。从海报中能够看出...

AI芯片:清华天机芯片内部结构分析(TianJic)

最近,清华七年磨一剑,放出一大招,文章直接登上NATURE的封面。《Towards artificial general intelligence with hybrid Tianjic chip architecture》。文章介绍了整个TianJic的结构及具体应用。本文延续以往一贯的风格,仅仅研究文章中公开的内部计算架构。一、整体思路人工智能通常有两个主要方向:(1)一种是面向计...

AI芯片:清华大学可重构混合神经网络处理器结构分析

清华大学微纳电子系的尹首一等人于2018年发表论文《A 1.06-to-5.09 TOPS/W Reconfigurable Hybrid-Neural-Network Processor for Deep Learning Applications 》,介绍了他们的面向深度学习人工智能算法的AI芯片架构及性能参数。这是大学的AI芯片,代表了学术界的一种想法。下面分析一下其内部结构。当然,主要..

AI芯片:寒武纪ShiDianNao结构分析

四、ShiDianNaoShiDianNao的出现是寒武纪在深度学习处理器上细分领域的更加深入。前面介绍的DianNao针对的是大部分的深度学习神经网络算法,包括CNN和RNN等。目前比较火而且应用面非常广的领域是计算机视觉,若在这个领域的算法精度实现巨大突破,那么,就将开启广阔的应用领域。比如自动驾驶/安防等等,利润丰厚的领域。图像识别,这类算法主要采用CNN结构。于是乎,开...

AI芯片:寒武纪NPU设计分析(DianNao)

国内人工智能处理器独角兽寒武纪,在这个领域,算是走在了世界前沿,经过最近几年的迅猛发展,取得了辉煌的成果。最近花了些时间研究了下寒武纪发表的一系列论文中介绍的NPU的结构。记录下来,算是对最近学习内容的总结。寒武纪从2014年开始,发表了一系列的论文,本文仅分析其中几篇:(1)DianNao: A Small-Footprint High-Throughput Accelerato...

AI芯片:英伟达NVDLA结构分析

英伟达开源了深度学习硬件架构:NVDLA。包括完整的源代码:Verilog代码,C_Model代码,以及验证平台代码。英伟达官网上也有详细的文档。非常值得学习推敲。作为从业者,我更加关注NVDLA卷积核的实现方式。不过,文档中并没有详细的说明。于是,直接看代码,分析结构。好记性不如烂笔头。顺便将看代码的过程中学习到的东西,记录下来。1.NVDLA硬件架构...

    共 14 条
  • 1
  • 2
  • 请选择