logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

即插即用系列 | CVPR 2025 LSRNA:利用隐空间超分与噪声对齐,打破扩散模型生成 4K 图像的效率瓶颈

本文提出了一种名为LSRNA(Latent Super-Resolution with Noise Alignment)的新框架,旨在解决扩散模型生成高分辨率图像时的效率瓶颈和结构一致性问题。该方法创新性地将超分辨率过程从像素空间转移到隐空间,通过轻量级隐空间超分网络快速提升分辨率,并设计噪声对齐机制解决分布不匹配问题。实验表明,LSRNA在保持生成质量的同时,将4K图像生成速度提升至现有方法的3

文章图片
#人工智能#目标检测#计算机视觉 +3
即插即用系列 | SliMamba——空谱维度魔术转换,打造高光谱分类的超轻量级 Mamba 架构

本文提出了一种超轻量级卷积-Mamba混合架构SliMamba,用于解决高光谱图像分类中的光谱冗余和样本稀缺问题。核心创新包括:(1)光谱选择卷积(SSC),通过维度交换实现低成本的跨通道特征提取;(2)重叠中心Mamba(OC-Mamba),通过蛇形扫描和衰减位置编码强化中心像素先验。实验表明,SliMamba在仅20K参数量下,显著超越现有方法,在多个数据集上达到SOTA精度。该模型为高维物理

文章图片
#数据挖掘#目标检测#人工智能 +3
即插即用系列 | TGRS 2025 ASCNet:残差Haar小波(RHDWT)与列非均匀校正(CNCM)-提升红外小目标检测精度

摘要 本文提出ASCNet(非对称采样校正网络)用于红外图像去条纹。针对传统基于小波的U-Net存在的跨层级列语义鸿沟问题,ASCNet创新性地采用残差哈尔离散小波变换(RHDWT)作为下采样器,融合条纹方向先验和数据驱动特征;同时使用像素重组(PS)作为上采样器,避免语义偏差。网络还包含列非均匀性校正模块(CNCM),通过列注意力、空间注意力和自校准分支捕获全局列相关性。实验表明,ASCNet在

文章图片
#目标检测#人工智能#计算机视觉 +3
即插即用系列 | IEEE TMM 2025 SPDFusion:当语义分割成为图像融合的“导师”

本文提出了一种名为 SPDFusion 的新型融合框架,旨在解决传统红外与可见光图像融合方法忽略语义信息,导致融合图像在下游高级视觉任务(如语义分割)中表现不佳的问题。其核心策略是利用预训练的语义分割模型提取语义先验知识,通过**语义特征感知模块 (SFPM) 和 语义特征嵌入模块 (SFEM)将这些高层语义信息深度注入到融合过程中。同时,结合区域语义对抗损失,强制模型针对不同类别的物体区域进行精

文章图片
#人工智能#图像处理#深度学习 +2
即插即用系列 | CVPR 2025:SCSegamba:轻量级结构感知 Mamba,重新定义裂缝分割 SOTA

本文提出了一种轻量级裂缝分割网络SCSegamba,通过结构感知视觉状态空间(SAVSS)模块融合门控瓶颈卷积(GBC)和结构感知扫描策略(SASS),在保持极低参数量(约1M)的同时精确分割复杂裂缝。SCSegamba采用U型架构,利用多向扫描捕捉裂缝连续性,结合门控机制抑制背景噪声。实验表明,该方法在DeepCrack数据集上达到88.58% mIoU,计算量仅为1.45GFLOPs,显著优于

文章图片
#transformer#人工智能#深度学习 +3
即插即用系列 | arxiv 2025 CPDATrack:Transformer 跟踪新突破!上下文感知剪枝 + 判别式注意力,提速 37% 且精度超越 OSTrack

本文提出CPDATrack,一种新型Transformer跟踪框架,通过上下文感知Token剪枝(CTP)和判别式选择性注意力(DSA)解决现有方法的计算冗余和干扰问题。CTP模块在剪枝背景Token的同时保留目标周围上下文信息,防止语义丢失;DSA机制则抑制背景和干扰物的注意力贡献。实验表明,该方法在LaSOT等数据集上FLOPs降低37%的同时性能优于基线模型。核心创新在于"先保全后

文章图片
#transformer#剪枝#深度学习 +4
即插即用系列 | ECCV 2024 SMFANet:轻量级图像超分新SOTA,自调制特征聚合网络详解

本文提出了一种轻量级的自调制特征聚合网络SMFANet,用于高效图像超分辨率。针对现有Transformer方法计算量大且易产生过度平滑的问题,SMFANet通过双分支结构实现全局与局部信息的协同增强:EASA分支利用卷积近似自注意力捕获全局信息,LDE分支提取高频局部细节,并通过自调制机制动态融合。此外,引入部分卷积前馈网络PCFN进一步降低计算冗余。实验表明,该方法在保持极低计算量的同时,性能

文章图片
#网络#深度学习#人工智能 +3
即插即用系列 | CVPR 2025 MK-UNet: 多核深度可分离卷积,重新定义轻量级医学图像分割

摘要:本文提出MK-UNet,一种超轻量级医学图像分割网络,通过**多核深度卷积(MKDC)**实现多尺度特征提取,仅需0.316M参数和0.314G FLOPs。核心创新包括:1)多核倒残差模块(MKIR)高效编码特征;2)分组注意力门(GAG)优化特征融合;3)纯CNN架构避免Transformer计算开销。实验表明,MK-UNet在六个医学数据集上超越TransUNet(参数量少333倍)和

文章图片
#深度学习#计算机视觉#人工智能 +3
即插即用系列 | ECCV 2024 WTConv:利用小波变换实现超大感受野的卷积神经网络

本文提出了一种新型卷积层WTConv,通过级联小波变换将输入特征分解为多频子带,在降采样后的频带上执行小卷积操作,以对数级参数增长实现接近全局的感受野。该方法可作为深度卷积的即插即用替代品,显著提升模型的形状偏置和对图像腐蚀的鲁棒性。实验表明,WTConv在ImageNet分类、ADE20K分割和COCO检测等任务上性能优于传统大核卷积方法,且参数效率更高。核心创新在于利用小波变换的多尺度特性,用

文章图片
#cnn#人工智能#神经网络 +4
即插即用系列 | CVPR InceptionNeXt:当 Inception 遇上 ConvNeXt,大核卷积的速度瓶颈被打破了吗?

摘要: 论文《InceptionNeXt》提出了一种新型CNN架构,通过融合Inception思想与ConvNeXt的大核卷积优势,解决了传统大核卷积内存访问成本高的问题。核心创新是Inception深度卷积,将大核分解为并行的小方核、带状核和恒等映射分支,在保持大感受野的同时显著降低计算复杂度。实验显示,InceptionNeXt-T在ImageNet-1K上比ConvNeXt-T快1.6倍且精

文章图片
#深度学习#人工智能#目标检测 +3
    共 59 条
  • 1
  • 2
  • 3
  • 6
  • 请选择