
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
人眼虹膜直径范围大概在11.7±0.5mm。因此我们可以利用相似三角形计算人眼与摄像头传感器的距离

MediaPipe 是一款由 Google Research 开发并开源的多媒体机器学习模型应用框架。提供多种错误坐姿情况的判断。

深度学习的”hello world“(【深度学习实战1】:基于Keras的手写数字识别(非常详细、代码开源))已经更新完了,会了手写数字识别就说明一只脚已经踏进了深度学习的大门! 今天博主带来第二个实战内容:基于Keras的cifar10图像分类。全是干货,文末附完整代码!一、准备工作设备\库型号\版本显卡GTX1650驱动程序版本457.49tensorflow-gpu版本2.4.0ker

基于深度学习的多标签图像分类,使用时尚产品数据集。工程充分将代码解耦,便于代码管理。

一、简述在[【深度学习经典网络架构—8】:注意力机制之SE_Block](https://blog.csdn.net/qq_42856191/article/details/123655146?spm=1001.2014.3001.5501)中,我们介绍了CNN的通道注意力模块SE_Block,本次带来的是另一个即用即插的注意力模块CBAM。论文链接:[CBAM: Convolutional Bl

使用谷歌MediaPipe框架实现人脸关键点检测,获取人脸区域400多个3D关键点,并在图中标记出部分区域。

一、简述在学术界,大多围绕着如何提高视觉任务的SOTA进行研究,但在工业界,一个良好的模型如何移植到计算能力不足的移动设备上才是重点考虑的问题。ShuffleNet是由旷视研究院于2018年发表在CVPR上的一篇文章。AI四小龙之一的旷视,多次在顶级会议(如CVPR、ECCV、ICCV)上发表文章。ShuffleNet的第一作者 Xiangyu Zhang 张祥雨 也是里程碑式神经网络ResNet

😺一、简述自从AlexNet赢得ImageNet挑战赛:ILSVRC 2012以来,卷积神经网络已成为计算机视觉中的普遍应用。总体趋势是制作更深、更复杂的网络,以实现更高的准确度。然而,这些提高准确性的进步并不一定会使网络在规模和速度方面更有效率。在机器人、汽车自动驾驶和增强现实等许多现实世界的应用中,识别任务需要在计算受限的平台上及时执行。谷歌提出MobileNet的目的就是**构造一个可以在

本节我们带来使用AlexNet经典网络进行手写数字识别!文末附完整程序!很多地方,如数据集获取,网络训练等都和【深度学习实战—3】:基于LetNet-5的手写数字识别(附Keras实现)差不多,有不同的就是网络的搭建,😺一、网络搭建因为论文中的alexnet的输入是(227, 227, 3),所以我们在搭建网络的时候,要将输入改为(28, 28, 1)。

目录一、网络简介二、网络结构2.1 网络配置2.2 网络立体图结构2.3 网络平面图结构三、网络特点四、Keras实现4.1 程序编写4.2 打印模型信息五、总结一、网络简介VGG网络是由牛津大学计算机视觉组和谷歌DeepMind公司共同设计的。VGG网络并且在2014年在ILSVRC大赛上获得了定位项目的第一名和分类项目的第二名。作者通过VGG论证了一个非常重要的结论:CNN的深度与小卷积核的使








