logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CVPR 2025 | GIFNet:底层任务交互破局

目前的图像融合方法大多优先考虑高级任务,然而,这种高级监督在一定程度上与底层图像融合问题脱节。相比之下,我们建议从数字摄影融合中利用底层视觉任务,通过像素级监督实现有效的特征交互。这种新范式为无监督多模态融合提供了有力指导,而无需依赖抽象语义,增强了任务共享特征学习,从而具有更广泛的适用性。由于混合图像特征和增强的通用表示,所提出的GIFNet 支持多种融合任务,在已见和未见场景中,单个模型都能实

文章图片
#论文阅读
TPAMI 2025 | SHIP : 基于协同高阶交互的多模态图像融合方法

本文为作者对原论文的学习笔记与心得分享,严格遵循原文的公式、逻辑和实验结论,补充了公式符号解释和核心思路梳理,受个人学识与理解所限,文中对论文内容的解读或有不够周全之处,一切以原论文正式表述为准。三大问题,设计**残差信息记忆(RIM)、跨阶信息整合(COII)、跨阶注意力演化(COAE)**三大核心机制,进一步提升跨模态信息交互能力,所有机制均适配VIF和全色锐化两大任务。为目标检测模型,在M3

文章图片
#论文阅读
CVPR 2024 | Fusion-Mamba :用于跨模态目标检测

跨模态融合能够有效整合不同模态的互补信息,提升目标检测性能,使其在更广泛的应用场景中更具实用性和鲁棒性。现有融合策略通过精心设计的神经网络模块组合不同类型的图像或融合不同骨干网络特征,但这些方法忽略了模态差异对跨模态融合性能的影响。本文基于改进的曼巴(Mamba)模型,引入门控机制,通过在隐藏状态空间中关联跨模态特征,探索跨模态融合的新范式。图1. 热力图可视化。(a)和(b)为初始RGB和IR输

文章图片
#论文阅读#目标检测#人工智能
TIV 2024 | CDC-YOLOFusion 利用跨尺度动态卷积融合实现可见光-红外目标检测

题目:CDC-YOLOFusion: Leveraging Cross-scale Dynamic Convolution Fusion for Visible-Infrared Object Detection期刊:IEEE Transactions on Intelligent Vehicles (TIV)论文:https://ieeexplore.ieee.org/document/1063

文章图片
#论文阅读#目标检测#人工智能
TIV 2024 | CDC-YOLOFusion 利用跨尺度动态卷积融合实现可见光-红外目标检测

题目:CDC-YOLOFusion: Leveraging Cross-scale Dynamic Convolution Fusion for Visible-Infrared Object Detection期刊:IEEE Transactions on Intelligent Vehicles (TIV)论文:https://ieeexplore.ieee.org/document/1063

文章图片
#论文阅读#目标检测#人工智能
到底了