
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
提供从理论指导到代码实现的全程科研支持(重识别、人脸系列、目标检测、分类网络、综合项目、deepseek),支持定制化项目开发。

本文介绍了一种融合大模型与视觉识别技术的人机交互系统,通过目标检测(YOLO)、手部关键点识别和BLIP大模型,实现AI对世界的智能描述。用户可通过手势圈选特定区域,系统会实时分析并生成语音描述(如"手机屏幕上显示着一只猫"),还能自定义描述细节。该技术方案实现了"视觉理解-语言生成-语音输出"的完整交互闭环,源代码支持有偿获取。

本项目基于YOLOv8和ResNet实现了车辆重识别系统升级,在检测速度和精度上均有显著提升。系统支持三大核心功能:重识别训练、跨视频检测和可视化GUI界面。开发环境采用OpenCV、PyTorch、PyQt5等技术栈搭建,包含完整的深度学习框架和可视化工具包。项目提供有偿技术支持服务,包含技术指导和效果展示,适用于智能交通监控等应用场景。

#训练自己的数据集一、准备数据集1.准备数据集:先在网上查有没有已经标注的公共数据集,如COCO、VOC数据集,如果公共数据集中没有所需的类,则自己在网上找图片即可(图像尽可能保存为jpg格式),图像尽可能要求分辨率高,背景环境简单2.数据集的标注:在目标检测中常用labelImg工具进行标注,工具下载地址:link标注工具github界面如图所示:下载后解压,使用说明见下载文件中的readme.
目标检测中libtorch推理与图像分类和分割不同,目标检测需要对边界框进行解码。本项目支持CPU、GPU推理,剪枝后的模型也可用进行推理。

在上一篇文章中有讲解以分类网络为例的知识蒸馏,这篇文章将会针对目标检测网络进行蒸馏。知识蒸馏是一种。这里的压缩需要和量化与剪枝进行区分,并不是严格意义上的压缩。这里将要讲的蒸馏是,也是一种常用的方法,他是将已经训练好的teacher model对student model进行蒸馏。teacher model是一个在精度表现上优良的模型,而student model往往是精度差一些,但推理速度高的模
在深度学习训练中,除了设计有效的卷积神经网络框架外,更重要的是数据的处理。在训练之前需要对训练数据进行预处理。比如在目标检测网络训练中,首先需要划分训练集和测试集,然后对标签、边界框等进行处理后才能送入网络进行训练,本文章以VOC数据集格式为例,对数据集进行预处理后送入目标检测网络进行训练。【附代码】
这篇文章是对之前搭建目标检测框架的补充内容。主要是讲解如何进行边界框的解码过程获得最终的结果。将一行一行的理解检测代码。
终于更新了,本篇是实现了SSD的tensorrt 推理【python版】。YOLOv4以及YOLOv5C++版的tensorrt推理可以看我之前的文章。SSD代码我这里是在b站up主Bubbliiiing的pytorch版SSD的基础上进行的实现。

在介绍导出engine过程需要先介绍一下会遇到的相关术语。1.建立logger:日志记录器2.建立Builder:网络元数据用于搭建网络的入口,网络的TRT内部表示以及可执行程序引擎都是由该对象的成员方法生成








