
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文提出LSRNA框架,通过将超分辨率过程转移到隐空间,显著提升扩散模型生成高分辨率图像的效率。核心创新包括:1) 轻量级隐空间超分网络(LSR)快速放大潜变量;2) 频率感知噪声对齐(NA)模块解决分布不匹配问题。实验表明,该方法在生成4K图像时比现有技术快3倍,同时避免结构崩坏和重复纹理问题。LSRNA可无缝集成到现有扩散模型中,为高分辨率图像生成提供高效解决方案。

本文提出LAM-YOLO模型,针对无人机航拍图像中目标尺寸小、遮挡严重和光照复杂等问题,在YOLOv8基础上引入光照-遮挡注意力机制(LAM)和内卷模块。LAM通过混合注意力增强特征提取能力,改进的检测头和SIB-IoU损失函数提升小目标检测精度。实验表明,该模型在VisDrone2019数据集上mAP提升7.1%,有效解决了复杂场景下的目标检测难题。核心创新包括LAM模块、辅助检测头和SIB-I

本文提出HS-FPN网络,通过频域和空间感知增强小目标检测。针对小目标特征微弱问题,设计了高频感知模块(HFP)利用DCT变换提取高频特征,增强小目标信号;同时提出空间依赖感知模块(SDP),通过像素级交叉注意力解决特征不对齐问题。实验表明,在AI-TOD数据集上HS-FPN使Faster R-CNN的AP提升2.0,Cascade R-CNN提升3.4。该网络计算开销小,模块可即插即用,适用于小

本文提出了一种针对遥感图像中细长目标检测的新方法Strip R-CNN。该方法创新性地设计了大型条状卷积模块(Strip Module),通过序贯的正交条状卷积(1×K和K×1)替代传统方形大卷积核,在降低计算量的同时更有效地捕捉细长目标的各向异性特征。网络架构包含StripNet骨干和Strip Head检测头,其中检测头解耦分类、角度回归和定位任务,并在定位分支中嵌入Strip Module以

本文提出了一种频域-空域融合网络FSCFNet,用于红外小目标检测。针对红外图像信噪比低、目标微小的问题,该方法在YOLOv10n架构基础上引入三个关键模块:FSConv通过小波变换分离处理高低频特征,ACA利用非对称注意力增强目标响应,MRCB采用多尺度空洞卷积捕捉上下文。实验表明,该方法在SIRST等数据集上mAP达83.5%,同时保持实时检测速度。这些模块也可迁移至其他小目标检测任务。

本文提出WPFormer模型,用于表面缺陷检测。其核心创新是双域Transformer解码器(D2T),通过并行的小波增强跨注意力(WCA)和原型引导跨注意力(PCA)模块,分别在频率域和空间域优化查询。WCA利用小波变换提取高频缺陷特征并抑制噪声,PCA通过原型聚类过滤背景冗余。实验表明,该方法能有效检测微弱缺陷,在多个数据集上达到SOTA性能。代码已开源。

SwiftFormer提出了一种高效的加法注意力机制,用于移动端实时视觉任务。其核心创新是将传统自注意力中的矩阵乘法替换为逐元素乘法和线性层,将复杂度从O(N²)降至O(N)。这种设计消除了计算瓶颈,使Transformer模块可部署在网络的各个阶段。实验表明,SwiftFormer系列模型在移动设备上实现了SOTA的速度-精度平衡,例如SwiftFormer-S比MobileViT-v2快2倍且

本文提出SCSA(空间与通道协同注意力)模块,通过串行结构SMSA和PCSA探索空间与通道注意力的协同效应。SMSA利用多尺度卷积提取多语义空间信息,PCSA通过渐进式压缩和通道自注意力缓解语义差异。实验表明,SCSA在多个视觉任务中优于现有注意力机制,能更精确地聚焦关键特征区域。代码已开源。

本文提出ABC模型,用于红外小目标检测,通过融合CNN的局部特征提取能力和Transformer的全局相关性建模。核心创新包括:1) CLFT模块,采用双线性注意力计算全局相关性并与局部特征相乘,有效抑制噪声;2) UCDC模块,通过动态调整感受野精细化处理深层特征。实验表明,该方法在抑制虚警和增强目标特征方面具有显著优势,为红外小目标检测提供了新思路。

MobileNetV4提出了一种通用移动端模型架构,通过创新设计解决了移动设备硬件碎片化带来的性能差异问题。核心创新包括:1)通用倒残差模块(UIB),可动态适配不同硬件特性;2)专为移动端优化的Mobile MQA注意力机制,减少39%推理耗时;3)基于屋顶线模型的理论分析指导架构设计;4)改进的两阶段NAS搜索策略。实验表明,MNv4在CPU、GPU、DSP等多种硬件上均能实现帕累托最优,真正








