logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

即插即用系列 | CVPR 2025:SCSegamba:轻量级结构感知 Mamba,重新定义裂缝分割 SOTA

本文提出了一种轻量级裂缝分割网络SCSegamba,通过结构感知视觉状态空间(SAVSS)模块融合门控瓶颈卷积(GBC)和结构感知扫描策略(SASS),在保持极低参数量(约1M)的同时精确分割复杂裂缝。SCSegamba采用U型架构,利用多向扫描捕捉裂缝连续性,结合门控机制抑制背景噪声。实验表明,该方法在DeepCrack数据集上达到88.58% mIoU,计算量仅为1.45GFLOPs,显著优于

文章图片
#transformer#人工智能#深度学习 +3
即插即用系列 | arxiv 2025 CPDATrack:Transformer 跟踪新突破!上下文感知剪枝 + 判别式注意力,提速 37% 且精度超越 OSTrack

本文提出CPDATrack,一种新型Transformer跟踪框架,通过上下文感知Token剪枝(CTP)和判别式选择性注意力(DSA)解决现有方法的计算冗余和干扰问题。CTP模块在剪枝背景Token的同时保留目标周围上下文信息,防止语义丢失;DSA机制则抑制背景和干扰物的注意力贡献。实验表明,该方法在LaSOT等数据集上FLOPs降低37%的同时性能优于基线模型。核心创新在于"先保全后

文章图片
#transformer#剪枝#深度学习 +4
即插即用系列 | ECCV 2024 SMFANet:轻量级图像超分新SOTA,自调制特征聚合网络详解

本文提出了一种轻量级的自调制特征聚合网络SMFANet,用于高效图像超分辨率。针对现有Transformer方法计算量大且易产生过度平滑的问题,SMFANet通过双分支结构实现全局与局部信息的协同增强:EASA分支利用卷积近似自注意力捕获全局信息,LDE分支提取高频局部细节,并通过自调制机制动态融合。此外,引入部分卷积前馈网络PCFN进一步降低计算冗余。实验表明,该方法在保持极低计算量的同时,性能

文章图片
#网络#深度学习#人工智能 +3
即插即用系列 | CVPR 2025 MK-UNet: 多核深度可分离卷积,重新定义轻量级医学图像分割

摘要:本文提出MK-UNet,一种超轻量级医学图像分割网络,通过**多核深度卷积(MKDC)**实现多尺度特征提取,仅需0.316M参数和0.314G FLOPs。核心创新包括:1)多核倒残差模块(MKIR)高效编码特征;2)分组注意力门(GAG)优化特征融合;3)纯CNN架构避免Transformer计算开销。实验表明,MK-UNet在六个医学数据集上超越TransUNet(参数量少333倍)和

文章图片
#深度学习#计算机视觉#人工智能 +3
即插即用系列 | ECCV 2024 WTConv:利用小波变换实现超大感受野的卷积神经网络

本文提出了一种新型卷积层WTConv,通过级联小波变换将输入特征分解为多频子带,在降采样后的频带上执行小卷积操作,以对数级参数增长实现接近全局的感受野。该方法可作为深度卷积的即插即用替代品,显著提升模型的形状偏置和对图像腐蚀的鲁棒性。实验表明,WTConv在ImageNet分类、ADE20K分割和COCO检测等任务上性能优于传统大核卷积方法,且参数效率更高。核心创新在于利用小波变换的多尺度特性,用

文章图片
#cnn#人工智能#神经网络 +4
即插即用系列 | CVPR InceptionNeXt:当 Inception 遇上 ConvNeXt,大核卷积的速度瓶颈被打破了吗?

摘要: 论文《InceptionNeXt》提出了一种新型CNN架构,通过融合Inception思想与ConvNeXt的大核卷积优势,解决了传统大核卷积内存访问成本高的问题。核心创新是Inception深度卷积,将大核分解为并行的小方核、带状核和恒等映射分支,在保持大感受野的同时显著降低计算复杂度。实验显示,InceptionNeXt-T在ImageNet-1K上比ConvNeXt-T快1.6倍且精

文章图片
#深度学习#人工智能#目标检测 +3
即插即用系列 | CVPR BMCNet:手把手带你了解双向事件流超分辨率模型

摘要: 本文提出BMCNet,一种用于事件流超分辨率(ESR)的双流解耦网络,通过独立处理正负事件并设计双边信息交换模块(BIE)实现特征互补。传统方法混合处理正负事件导致边缘模糊,而BMCNet将二者解耦为独立分支,利用BIE在通道维度交互全局结构信息,增强细节恢复能力。实验表明,该方法在真实与合成数据集上性能提升超11%,且BIE模块可扩展至多模态任务。代码已开源。 (字数:149)

文章图片
#人工智能#计算机视觉#深度学习 +3
即插即用系列 | SCTNet: 协同CNN与Transformer,池化注意力融合的高光谱图像分类网络

本文提出了一种协同CNN-Transformer网络(SCTNet)用于高光谱图像分类,通过双分支特征提取模块(TBFE)并行利用2D和3D卷积捕获局部空间-光谱特征,并设计混合池化注意力模块(HPA)增强特征表示。该网络还引入跨层特征融合机制(CFF)聚合Transformer编码器的多层输出,有效保留浅层关键信息。实验结果表明,SCTNet在五个基准数据集上超越了现有方法,包括最新的SS-Ma

文章图片
#cnn#transformer#分类 +3
即插即用系列 | CVPR 2025 LSRNA:利用隐空间超分与噪声对齐,打破扩散模型生成 4K 图像的效率瓶颈

本文提出LSRNA框架,通过将超分辨率过程转移到隐空间,显著提升扩散模型生成高分辨率图像的效率。核心创新包括:1) 轻量级隐空间超分网络(LSR)快速放大潜变量;2) 频率感知噪声对齐(NA)模块解决分布不匹配问题。实验表明,该方法在生成4K图像时比现有技术快3倍,同时避免结构崩坏和重复纹理问题。LSRNA可无缝集成到现有扩散模型中,为高分辨率图像生成提供高效解决方案。

文章图片
#超分辨率重建#人工智能#图像处理 +3
即插即用系列 | 2024 SOTA LAM-YOLO : 无人机小目标检测模型

本文提出LAM-YOLO模型,针对无人机航拍图像中目标尺寸小、遮挡严重和光照复杂等问题,在YOLOv8基础上引入光照-遮挡注意力机制(LAM)和内卷模块。LAM通过混合注意力增强特征提取能力,改进的检测头和SIB-IoU损失函数提升小目标检测精度。实验表明,该模型在VisDrone2019数据集上mAP提升7.1%,有效解决了复杂场景下的目标检测难题。核心创新包括LAM模块、辅助检测头和SIB-I

文章图片
#无人机#目标检测#深度学习 +3
    共 57 条
  • 1
  • 2
  • 3
  • 6
  • 请选择