logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

YOLOv8更换BiFPN并融合P2小目标检测层

FPN是一种用于处理多尺度信息的网络结构,通常与骨干网络(如ResNet或EfficientNet)结合使用,以生成不同分辨率的特征金字塔,从而提高对象检测和分割的性能。总的来说,BiFPN是一种改进的特征金字塔网络结构,通过双向连接、自适应特征调整和模块化设计,提高了对象检测和语义分割任务的性能,使得神经网络能够更好地理解和解释多尺度信息,从而在计算机视觉任务中发挥更大的作用。:BiFPN的引入

文章图片
#目标检测#人工智能#计算机视觉 +1
UCAS-AOD遥感旋转目标检测数据集——基于YOLOv8obb,map50已达96.7%

正例图像以P+数字序号命名,反例图像以N+数字序号命名,所有图像为PNG格式,尺寸为1280x659和1372x941。UCAS-AOD采用HBB(horizontal bounding box)的标注方法,图像的groundtruth采用txt格式保存,以图像的同名文档方式存储。遥感图像的分类依据是根据成像的介质不同来进行分类的。UCAS-AOD (Zhu et al.,2015)用于飞机和汽车

文章图片
#计算机视觉#目标检测#目标跟踪
多模态情感分析——基于交叉多头注意力CMA进行图文多模态融合(含MVSA数据集)

由两个独立的数据集组成,分别是MVSA-Single数据集和 MVSA-Multi数据集,前者的每条图文对只有一个标注,后者的每条图文对由三个标注者给出。删除 MVSA-Single 数据集中图片和文字标注情感的正负极性不同(存在positive和negative)的图文对,剩余的图文对中,如果图片或者文本的情感有一者为中性(neutral),则选择另一个积极或者消极的标签作为该图文对的情感标签,

文章图片
#人工智能#计算机视觉#深度学习
[HSRC2016]遥感图像舰船旋转目标检测数据集——HSRC2016一类、HSRC2016四类

是西北工业大学采集的用于轮船的检测的数据,包含4个大类19个小类共2976个船只实例信息。数据集所有图像均来自六个著名的港口,包括海上航行的船只和靠近海岸的船只,船只图像的尺寸范围从300到1500,大多数图像大于1000x600。注:HSRC数据集总数为1680张,但是只有1061张为有效进行标注的图像。在训练集、验证集和测试集中分别包含436、181和444张图像。设计、matlab appd

文章图片
#目标检测#人工智能#计算机视觉
Matlab数学建模——基于GSPA-IAHP的风险评价模型

综合运用区间层次分析法和广义集对分析法两种评价方法理论,建立了GSPA-IAHP风险评价模型。从B1、B2、B3、B4四个方面对A进行了风险分析和评价,对A主要的十三个风险C1-C13的评价指标重要度进行了排序,评价结果可知,该评价模型的计算过程简单、实用,体现了该方法的适用性,为类似项目的风险评价提供了参考价值,具有广泛的发展和应用。建立多层次分析结果模型建立区间判断矩阵计算各个指标评价的区间权

文章图片
#matlab#算法
Matlab数字信号处理——基于改进小波变换的图像去噪方法(7种去噪算法)

在传统小波去噪的基础上,结合离散余弦变换(DCT)的优势,对信号进行进一步处理,以提高去噪效果,特别适用于周期性或具有强局部特征的信号。该方法利用小波变换分离出信号中的噪声成分,并通过设置合适的阈值对小波系数进行收缩,保留主要信息的同时,去除噪声。通过引入最大熵原理,该算法在去噪过程中对信号进行最优估计,保持信号的信息量最大化,从而实现平衡信号和噪声的去除。模极大值法通过分析小波变换中信号的极大值

文章图片
#算法#matlab
CLIP大模型图文检索——原理解读及代码实现

例如,对于ImageNet的类别,可以将其转化为类似"A photo of a {object}"这样的句子,对于ImageNet的1000个类别,就可以生成1000个这样的句子。推理时,将需要分类的图像送入图像编码器以获取特征,然后计算图像特征与1000个文本特征的余弦相似度,选择最相似的文本特征对应的句子,从而完成分类任务。在推理过程中,给定一张图片,通过图像编码器可得到该图片的特征。CLIP

文章图片
#人工智能#pycharm#图文检索
Python图像处理——基于YOLOv12-Paddleocr的车牌实时检测系统(Pyqt5界面)

使用的数据集是CPDD2020。训练集5769张,验证集1001张,测试集5006张。类别一类LicensePlate。数据集格式为yolo格式的txt文件。appdesigner,gui设计、simulink仿真......希望能帮到你!图形界面,实现图片、视频及摄像头检测功能,并提供检测结果的实时反馈。:支持上传视频文件,对视频逐帧进行检测,并可视化结果。上传本地图片,进行检测,并展示检测前后

文章图片
#python#图像处理
大模型QLoRA微调——基于Qwen2-7B的自动化病历摘要生成系统

该系列模型包括5个尺寸的预训练和指令微调模型:Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B。为此,本项目基于 Qwen-7B大语言模型,通过QLoRA微调,使其从医疗文档中识别并提取这些信息。QLoRA 在不影响模型性能的前提下,将模型参数压缩为 4-bit 格式,并结合 LoRA 微调技术,进一步减少显存占用和计算资源消耗。是一

文章图片
#人工智能
    共 100 条
  • 1
  • 2
  • 3
  • 10
  • 请选择