
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文分析了YOLO系列目标检测框架从v5到v11的核心技术演进,重点对比了架构设计和损失函数两方面的优化。架构上,YOLOv11通过C3K2模块、C2PSA注意力机制和深度可分离卷积,实现了动态特征融合与轻量化设计;损失函数方面,引入NWD Loss和DFL+Focal Loss组合,增强了对小目标和密集场景的处理能力。这些改进使YOLOv11在计算效率、检测精度和场景适应性上均有显著提升,推动了

YOLOv11-OBB训练全流程指南 本文详细介绍了使用YOLOv11-OBB模型进行训练的全过程。首先需要准备符合标准格式的数据集,包括图片和YOLO-OBB格式标注文件,并配置相应的yaml文件定义数据集路径和类别信息。训练阶段可通过多GPU并行加速,关键参数包括epochs、batch size等。训练过程中可通过实时日志和TensorBoard监控损失曲线和mAP指标。验证阶段评估模型性能

本文针对ResNet18模型提出了一种全局残差块剪枝方法,重点裁剪了layer1至layer4中的所有残差块,同时保留第一层卷积conv1以维护基础特征提取能力。文章详细阐述了剪枝策略设计原理与代码实现,通过L1范数对残差块内的卷积层进行通道剪枝,并同步调整批归一化层参数。实验结果显示,该方法在保证模型精度的同时显著减少了参数量,为深度学习模型压缩提供了有效的实践方案。(150字)
通常我们在设计或者使用模型网络结构的时候,每一层的卷积数,核心大小和数量等等原因都有他们的作用和有意义,今天就来分享一下基础,怎么计算卷积神经网络的输入输出尺寸,这有利于在后面自己设计网络时候用到。

是一个大规模人脸防欺骗数据集,该数据集包含来自10,177个受试者的625,537张图像,包括人脸、光照、环境和欺骗类型等43个丰富的属性。有40个属性属于Live图像,包括皮肤、鼻子、眼睛、眉毛、嘴唇、头发、帽子、眼镜等所有面部成分和配件。3个属性属于恶搞图像,包括恶搞类型、环境和光照条件。如果要做人脸的活体检测,这个数据库是一个不错的选择。下载地址有两个:百度云下载Google云盘。

MobileNet 是一种专为移动和嵌入式设备设计的轻量级卷积神经网络架构,其核心优势在于通过创新的结构设计大幅减少参数量和计算量,同时保持较好的模型性能。接下来我们来探讨一下它的原理和优势。

本文针对ResNet18模型剪枝进行了优化改进,主要包含三个方面:1) 将剪枝目标层从底层conv1调整为中间层layer2.0.conv1,减少对基础特征的破坏;2) 采用基于激活值的前向传播方法评估通道重要性,优先剪除低激活通道;3) 改进微调策略,动态解冻关联层并使用更低学习率(0.0001)进行10轮微调。这些优化有效提升了剪枝后模型的稳定性和性能表现,特别是通过中间层剪枝和基于特征贡献的
最近一个小项目用到yolo的内容,需要用到darknet,因此需要进行darknet进行编译,因为之前也干过这个事情,不过当时只是为了验证,并没有对当时遇到的问题做记录。此次再次用到,应该是遇到了同样的坑,所以讲这次遇到的问题做了一次记录。opencv也用了很久,对它的各种编译都是很熟悉了,之前编译的时候都是用的cmake的方式,非常方便,也因此自己编译了一个常用的版本(够用就行),而且是静态库的

本文探讨了深度学习模型剪枝的必要性与实现方法,针对移动端设备资源受限问题,提出基于PyTorch的结构化通道剪枝方案。以ResNet18在CIFAR-10任务为例,详细阐述了6步流程:环境初始化、原始模型训练、卷积层剪枝(通过L2范数评估通道重要性)、剪枝后结构调整(BN层和残差连接适配)、模型微调及效果评估。重点展示了如何计算通道重要性、生成剪枝掩码、替换卷积层,并解决剪枝引发的后续层通道匹配问
YoloV5-OBB通过引入旋转框检测能力,显著提升了模型在倾斜目标场景下的检测性能。其核心改进包括旋转框表示、角度编码策略和旋转IoU计算等。虽然带来了一定的计算开销,但在需要精确检测旋转目标的场景下,这种改进是非常有价值的。未来,随着硬件加速和算法优化的进步,旋转目标检测技术将在更多领域得到广泛应用。
