logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

论文阅读 |[IEEE TPAMI 2025] | Probing Synergistic High-Order Interaction for Multi-Modal Image Fusion

本文为作者对原论文的学习笔记与心得分享,严格遵循原文的公式、逻辑和实验结论,补充了公式符号解释和核心思路梳理,受个人学识与理解所限,文中对论文内容的解读或有不够周全之处,一切以原论文正式表述为准。三大问题,设计**残差信息记忆(RIM)、跨阶信息整合(COII)、跨阶注意力演化(COAE)**三大核心机制,进一步提升跨模态信息交互能力,所有机制均适配VIF和全色锐化两大任务。为目标检测模型,在M3

文章图片
#论文阅读
【论文阅读 | CVPR 2024 | Fusion-Mamba :用于跨模态目标检测】

跨模态融合能够有效整合不同模态的互补信息,提升目标检测性能,使其在更广泛的应用场景中更具实用性和鲁棒性。现有融合策略通过精心设计的神经网络模块组合不同类型的图像或融合不同骨干网络特征,但这些方法忽略了模态差异对跨模态融合性能的影响。本文基于改进的曼巴(Mamba)模型,引入门控机制,通过在隐藏状态空间中关联跨模态特征,探索跨模态融合的新范式。图1. 热力图可视化。(a)和(b)为初始RGB和IR输

文章图片
#论文阅读#目标检测#人工智能
【论文阅读 TIV 2024 CDC-YOLOFusion 利用跨尺度动态卷积融合实现可见光-红外目标检测】

题目:CDC-YOLOFusion: Leveraging Cross-scale Dynamic Convolution Fusion for Visible-Infrared Object Detection期刊:IEEE Transactions on Intelligent Vehicles (TIV)论文:https://ieeexplore.ieee.org/document/1063

文章图片
#论文阅读#目标检测#人工智能
【论文阅读 TIV 2024 CDC-YOLOFusion 利用跨尺度动态卷积融合实现可见光-红外目标检测】

题目:CDC-YOLOFusion: Leveraging Cross-scale Dynamic Convolution Fusion for Visible-Infrared Object Detection期刊:IEEE Transactions on Intelligent Vehicles (TIV)论文:https://ieeexplore.ieee.org/document/1063

文章图片
#论文阅读#目标检测#人工智能
到底了