
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
0x00. 前言上篇文章系统的介绍了TVM Pass Infra,并解析了Relay树结构以及Constant Folding Pass的具体做法。这一节,我想先补充一下TVM Pass Infra的用法,然后再解析一下TVM中的一个非常重要的Pass即算符融合。0x01. 如何使用TVM Pass Infra关于TVM Pass Infra的介绍可以移步【从零开始学深度学习编译器】七,万字长文入
0x0. 介绍在开始阅读本篇文章之前,如果你对ONNX不是很了解介意先阅读我之前写的这几篇介绍ONNX文章:ONNX初探ONNX 再探onnx2pytorch和onnx-simplifier新版介绍以及大缺弦老师的:onnx simplifier 和 optimizer然后,这篇文章不会继续探索ONNX,而是展开另外一个有趣的话题,即深度学习框架是如何和ONNX进行交互的?笔者基于OneFlow深
前言我们前面分享了PCA,Fisher Face,LBPH三种传统的人脸识别算法,Dlib人脸检测算法。今天我们开始分享一下MTCNN算法,这个算法可以将人脸检测和特征点检测结合起来,并且MTCNN的级联结构对现代的人脸识别也产生了很大的影响。上篇为大家介绍MTCNN的算法原理和训练技巧,下篇为大家解析MTCNN算法的代码和进行demo演示。论文地址为:https://arxiv.org/ftp.
按照前面的思路,这一节进入到DarkNet的数据结构解析并且详细解释一下train_detector函数是如何加载数据并工作的。Darknet是一个C语言实现的神经网络框架,这就决定了其中大多数保存数据的数据结构都会使用链表这种简单高效的数据结构。基础数据结构为了解析网络配置参数, DarkNet 中定义了三个关键的数据结构类型。list 类型变量保存所有的网络参数, section类型变...
前言从这里开始,我会不定期的更新一些人脸识别的有趣算法和小demo算法,源码也会开放出来,自己在学习的过程中希望也能帮助到公众号中对这方面感兴趣的小伙伴,无论是从源码角度,还是从原理角度,我说清楚了,对在看的你有帮助就是我最大的幸福。人脸识别的需要的数据集可以自己制作,也可以从网上免费下载。我这里选了人脸识别中入门级别的一个数据集ORL人脸库,不得不说,我是在CSDN下载的这个库,花了我7个金..
0x0. 介绍在开始阅读本篇文章之前,如果你对ONNX不是很了解介意先阅读我之前写的这几篇介绍ONNX文章:ONNX初探ONNX 再探onnx2pytorch和onnx-simplifier新版介绍以及大缺弦老师的:onnx simplifier 和 optimizer然后,这篇文章不会继续探索ONNX,而是展开另外一个有趣的话题,即深度学习框架是如何和ONNX进行交互的?笔者基于OneFlow深
1. 前言深度学习在移动端的应用越来越广泛,而移动端相对于GPU服务来讲算力较低并且存储空间也相对较小。基于这一点我们需要为移动端定制一些深度学习网络来满足我们的日常续需求,例如SqueezeNet,MobileNet,ShuffleNet等轻量级网络就是专为移动端设计的。但除了在网络方面进行改进,模型剪枝和量化应该算是最常用的优化方法了。剪枝就是将训练好的大模型的不重要的通道删除掉,在几乎不影响
论文原文https://arxiv.org/pdf/1608.06993.pdf摘要论文先讲到了使用了ShortCur连接的话,网络已经变得越来越深。然后引入了论文要介绍的DenseNet,正是利用了shortcut连接的思想。每一层都将前面所有层的特征图作为输入,最后使用concatenate来聚合信息。实验显示,DenseNet消除了梯度消失问题,增大了特征重用,大大减少了参数量。并且在...
总的来说,TeleChat-7B具有一定的文创能力和代码能力,对于本次测试的大多数prompt可以生成较为合理的答案。但模型本身也存在大模型幻觉,指令跟随能力一般以及回答有概率重复的问题。但由于TeleChat模型的训练Token相比于主流模型已经比较少了,只有1.0T数据,所以相信上述问题通过更多高质量的数据以及PPO等训练可以进一步被缓解。

原理线性查找假设我们有一个线性表[0, 6, 3, 8, 7, 4, 11],我们寻找这个序列中离x距离最近的元素的值。所谓线性查找,就是暴力遍历这个表,找个离x的距离的元素。假设查找操作执行了n次,线性表的长度为m,那么这个过程的复杂度就是O(nm)。一点改进-二分查找如果我们让线性表升序排列,那么我们每次查找就可以使用二分的方式最多用logm次比较就可以找到离x最近的元素。算法的复杂度...







