
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文提出LAM-YOLO模型,针对无人机航拍图像中目标尺寸小、遮挡严重和光照复杂等问题,在YOLOv8基础上引入光照-遮挡注意力机制(LAM)和内卷模块。LAM通过混合注意力增强特征提取能力,改进的检测头和SIB-IoU损失函数提升小目标检测精度。实验表明,该模型在VisDrone2019数据集上mAP提升7.1%,有效解决了复杂场景下的目标检测难题。核心创新包括LAM模块、辅助检测头和SIB-I

本文提出了一种位置引导的动态感受野网络(PG-DRFNet),用于解决光学和SAR遥感图像中小目标检测的难题。该方法通过位置引导模块(PGM)将浅层网络中的小目标位置信息传递至深层,防止特征淹没;并采用动态感知卷积(DPC)自适应调整感受野形状,精准提取多尺度目标特征。配合组合检测头的辅助监督机制,该网络在多个数据集上达到SOTA性能。核心模块具有即插即用特性,可广泛应用于小目标检测任务。代码已开

本文提出了一种针对遥感图像中细长目标检测的新方法Strip R-CNN。该方法创新性地设计了大型条状卷积模块(Strip Module),通过序贯的正交条状卷积(1×K和K×1)替代传统方形大卷积核,在降低计算量的同时更有效地捕捉细长目标的各向异性特征。网络架构包含StripNet骨干和Strip Head检测头,其中检测头解耦分类、角度回归和定位任务,并在定位分支中嵌入Strip Module以

MobileNetV4提出了一种通用移动端模型架构,通过创新设计解决了移动设备硬件碎片化带来的性能差异问题。核心创新包括:1)通用倒残差模块(UIB),可动态适配不同硬件特性;2)专为移动端优化的Mobile MQA注意力机制,减少39%推理耗时;3)基于屋顶线模型的理论分析指导架构设计;4)改进的两阶段NAS搜索策略。实验表明,MNv4在CPU、GPU、DSP等多种硬件上均能实现帕累托最优,真正

下面的命令可以帮助我们查看Pytorch是否使用GPU:# 返回当前设备索引torch.cuda.current_device()# 返回GPU的数量torch.cuda.device_count()# 返回gpu名字,设备索引默认从0开始torch.cuda.get_device_name(0)# cud...
本文提出了一种高效的神经网络架构PartialNet,通过创新的部分通道机制(PCM)将特征通道分组处理,一部分采用卷积提取局部特征,另一部分并行应用视觉注意力捕获全局信息。该方法设计了三种混合模块(PAT_ch、PAT_sp、PAT_sf)和可学习的动态部分卷积(DPConv),在保持低计算量的同时增强特征交互。实验表明,PartialNet在ImageNet等任务上实现了更优的速度-精度平衡,

文章摘要 ConDSeg提出了一种基于对比驱动特征增强的通用医学图像分割框架,通过两阶段策略解决医学图像中的边界模糊和共现误导问题。框架包含:1)一致性增强(CR)预训练提升编码器鲁棒性;2)语义信息解耦(SID)模块将特征分解为前景/背景/不确定区域;3)对比驱动特征聚合(CDFA)利用前景背景对比信息引导特征融合;4)尺寸感知解码器(SA-Decoder)分别处理不同尺度目标。实验表明,该方法

本文提出TDCNet网络,通过时间差分卷积重参数化(TDCR)模块和TDC引导的时空注意力(TDCSTA)机制,有效解决移动红外小目标检测中的弱特征和背景干扰问题。TDCR在训练时采用多尺度差分分支,推理时重参数化为单一3D卷积;TDCSTA利用运动特征指导语义增强。实验在新建IRSTD-UAV数据集上达到SOTA性能。该方法计算高效,适用于视频动作识别等场景,相关代码已开源。

🔍 AI 即插即用模块"军火库"开源:SCConv详解 本文提出SCConv模块,通过空间重建(SRU)和通道重建(CRU)两阶段处理,有效消除CNN特征中的双重冗余。SRU利用GN的缩放因子γ评估特征图信息量,分离并交叉重建特征;CRU采用非对称双分支结构,低成本融合高低层特征。实验表明,SCConv可替代标准3×3卷积,在ResNet50上降低34%计算量的同时提升精度。

提出了一种名为 TBSN(Transformer-Based Blind-Spot Network)的新型自监督图像去噪网络。其核心思想是系统性地分析并重新设计 Transformer 中的自注意力机制,使其在满足“盲点(Blind-Spot)”约束的前提下运行








