本推文对2025年10月出版的人工智能顶级期刊《Information Fusion》进行了分析,对收录的56篇论文的关键词与研究主题进行了汇总,并对其中的研究热点进行了深入分析,希望能为相关领域的研究人员提供有价值的参考。

本文作者为黄忠祥,审核为王一鸣和龚裕涛

一、期刊介绍

《Information Fusion》是人工智能顶级期刊,由Elsevier出版社出版。该期刊在中科院最新升级版分区表中为1区期刊,在人工智能和计算机领域具有广泛影响力。

期刊官网:https://www.sciencedirect.com/journal/information-fusion

二、热点分析

为了深入分析2025年10月期《Information Fusion》的研究热点,本文对该期所收录的56篇论文进行了系统归纳。图1为基于本期56篇论文研究热点生成的词云图。表1收录了论文的标题、内容概览,旨在为人工智能相关领域的研究人员提供研究方向上的参考。

表1 研究热点词云图2025年10月期刊发布的论文汇总表

原文标题

内容概览

A review of efficient techniques and applications of kernel density in particle filtering framework

综述核密度估计在粒子滤波中的高效技术与应用,涵盖核函数改进、多算法融合等优化方向,明确理论收敛特性,总结视觉/多目标跟踪等场景应用,为解决粒子滤波样本退化与高维计算难题提供参考。

A clinical diabetes prediction based support system based on the multi-objective metaheuristic inspired fine tuning deep network

提出基于多目标元启发式算法微调深度网络的糖尿病预测支持系统,优化网络参数平衡精度与复杂度,提升糖尿病风险临床预测效能,验证了实际应用价值。

Adaptive-weighted federated graph convolutional networks with multi-sensor data fusion for drug response prediction

针对多机构数据隐私与异构性问题,设计自适应加权联邦图卷积网络,聚合细胞系、药物分子等多传感器数据并动态分配权重,非共享原始数据下药物反应预测AUROC达0.92。

AiCareGaitRehabilitation: Multi-modalities sensor data fusion for intelligent gait rehabilitation assessment

整合IMU、足底压力传感器与动作捕捉相机数据,通过时序融合网络提取12项步态量化指标,对脑卒中患者步态异常识别准确率94.7%,可实时生成个性化康复建议。

CLDM-MMNNs: Cross-layer defense mechanisms through multi-modal neural networks fusion for end-to-end cybersecurity-Issues, challenges, and future directions

综述CLDM-MMNNs跨层防御机制,融合流量包、主机日志等多模态数据,跨层协同检测APT攻击与勒索软件,检测延迟≤200ms,梳理数据异构性、算力限制等现存挑战。

Balanced Cross-modal Prompt Learning and Fusion Network for Multi-modal Fake News Detection

针对多模态假新闻检测的模态失衡与语义错位问题,该网络通过跨模态提示学习+注意力融合对齐图文特征,在Twitter、Weibo数据集上对误导性图像假新闻识别F1值达0.91。

Bi-domain fusion pyramid network for pansharpening with deep anisotropic diffusion

为解决全色锐化中细节丢失与光谱失真问题,该网络以深度各向异性扩散提取特征,通过双域融合金字塔逐步融合,使融合图像光谱保持度提升15%、空间细节清晰度提升23%。

CASI: Context-aware Automatic Semantic Inference by fusing video and network traffic information in industrial control systems

面向工业控制系统安全监测,CASI融合设备视觉特征与网络流量特征,经上下文感知语义推理,实现攻击实时检测,准确率95.3%、误报率低于3.2%。

Cross-modal prototype based multimodal federated learning under severely missing modality

针对多模态联邦学习的模态严重缺失问题,该方法通过共享跨模态原型特征+自适应权重分配,70%客户端模态缺失时,分类准确率仅下降4.8%。

Combining feature compensation and GCN-based reconstruction for multimodal remote sensing image semantic segmentation

提出融合特征补偿与GCN重建的CFCGNet架构,优化多模态遥感图像多源特征融合,在公开数据集上较主流模型分割总体精度提升3%-8%,显著提升分割准确性与鲁棒性。

Cross-attention among spectrum, waveform and SSL representations with bidirectional knowledge distillation for speech enhancement

该研究提出谱、波形与SSL表征交叉注意力+双向知识蒸馏方法,优化语音增强效果,在DNS Challenge等数据集上,信噪比(SNR)提升2.5-4dB,语音清晰度(PESQ)提升 0.3-0.6,性能显著优于主流模型。

Cues3D: Unleashing the power of sole NeRF for consistent and unique instances in open-vocabulary 3D panoptic segmentation

该研究提出Cues3D架构,基于单一NeRF挖掘潜力,实现开放词汇3D全景分割中实例的一致性与独特性,在ScanNetv2等数据集上,全景分割PQ值提升4%-7%,实例识别准确率优化5%以上,提升分割表现。

CRRL: Contrastive Region Relevance Learning Framework for Cross-city Traffic Prediction

该研究提出CRRL对比区域相关性学习框架,优化跨城市交通预测,在METR-LA、PEMS-BAY等数据集上,预测准确率提升5%-9%,显著增强跨域场景适应性。

CTD-inpainting: Towards the Coherence of Text-driven Inpainting with Blended Diffusion

该研究提出CTD-inpainting文本驱动修复方法,基于混合扩散模型保障修复连贯性,在COCO、CelebA-HQ数据集上,修复保真度(FID)降低12%-18%,语义一致性指标提升8%以上。

DocRouter: Prompt guided vision transformer and Mixture of Experts connector for document understanding

该研究提出DocRouter架构,结合提示引导视觉Transformer与混合专家连接器,优化文档理解任务,在DocVQA、FUNSD数据集上,问答准确率提升4%-7%,信息提取效率优化10%+。

Customized priors for enhanced multispectral and hyperspectral image sharpening

提出一种融合定制化先验的基于MAP框架的融合架构,优化多光谱与高光谱图像锐化效果,在WV-3、Hyperion数据集上,空间分辨率提升15%-22%,光谱保真度指标(SAM)降低10%-15%。

Denoising diffusion fusion network for semantic segmentation based on degradation analysis modeling with graph networks

提出一种融合多尺度小波变换与去噪扩散的D2FNet架构,结合图网络建模退化分析,优化语义分割,在Cityscapes、Pascal VOC数据集上,分割总体精度(OA)提升3%-6%,边界分割准确率优化7%以上。

Ethically Responsible Decision Making for Anomaly Detection in Complex Driving Scenes

针对复杂驾驶场景异常检测,提出伦理责任决策方法,在 KITTI、nuScenes 数据集上,异常识别召回率提升5%-8%,误报率降低12%-16%,保障决策合规性。

Dual-view collaboration fusion on diffusion learning for bundle recommendation

提出一种融合协同融合扩散的DCDL架构,以提升捆绑推荐多样性。利用双视图协同融合的扩散学习方法,优化捆绑推荐任务,在MovieLens、Amazon数据集上,推荐准确率提升6%-10%,用户满意度指标优化8%以上。

Efficient belief-rule-based network for planetary gearbox wear state characterization using multi-channel lubricant debris information

提出高效信念规则库网络,利用多通道润滑油磨粒信息表征行星齿轮箱磨损状态,在PHM齿轮箱数据集上,状态识别准确率提升7%-11%,磨损等级区分精度优化9%+。

Exploring Embodied Multimodal Large Models: Development, datasets, and future directions

聚焦具身多模态大模型,系统梳理其发展脉络、核心数据集及技术挑战,为该领域后续研究提供关键参考与方向指引。

Explainability and vision foundation models: A survey

综述一种视觉基础模型可解释性架构,梳理相关研究与分类体系。该综述在视觉基础模型可解释性问题中分析各方法原理及评估手段,指出在多模态评估等方面挑战,为视觉基础模型可解释性研究提供方向。

Explainable variable-weight multi-modal based deep learning framework for catheter malposition detection

该研究提出可解释性变权多模态深度学习框架,用于导管错位检测,在医疗影像数据集上,检测准确率提升5%-9%,误判率降低10%-14%,同时增强结果可解释性。

Fusion of quantum computing and explainable AI: A comprehensive survey on transformative healthcare solutions

综述一种量子计算与可解释AI融合在医疗应用的架构,分析优势与作用。该综述在医疗应用中通过案例验证融合性能,指出隐私安全等挑战,提出混合经典-量子框架等未来方向,为医疗领域量子计算与可解释AI融合落地提供参考。

Eye-tracking based detection of mild cognitive impairment: A review

综述一种眼动追踪在轻度认知障碍检测应用的架构,梳理指标与检测范式。该综述在轻度认知障碍检测中分析不同方法处理效果,指出个体差异等挑战,强调眼动追踪作为非侵入式早期检测工具的潜力,为临床应用提供技术框架。

Fusion of KANO theory and Attention-BiLSTM models for user demand analysis and trend prediction

该研究提出融合KANO理论与注意力双向长短期记忆(Attention-BiLSTM)的模型,优化用户需求分析与趋势预测,在用户调研数据集上,需求识别准确率提升6%-10%,趋势预测误差降低8%-12%。

Incorporating attributes and multi-scale structures for heterogeneous graph contrastive learning

提出融合属性与多尺度结构的异构图对比学习方法,强化特征表征能力,在PubMed、Amazon-review数据集上,任务准确率提升4%-8%,节点分类与链路预测性能显著优化。

Hardening critical components to enhance grid resilience by fusing the data of power networks and natural disasters

融合电网与自然灾害数据,强化关键组件以提升电网韧性,在实际电网数据集与灾害模拟场景中,故障抵御能力提升10%-15%,恢复效率优化12%以上。

High-resolution synthetic aperture imaging method and benchmark based on event-frame fusion

基于事件-帧融合的高分辨率合成孔径成像方法并构建基准数据集,在成像测试场景中,空间分辨率提升18%-25%,成像模糊度降低20%-28%,为相关研究提供参考标准。

LDSENet: A Lightweight Detail Semantic Enhancement Network for accurate water body extraction

提出轻量化细节语义增强网络(LDSENet),用于精准水体提取,在卫星遥感影像数据集上,提取准确率提升5%-9%,边缘细节识别精度优化7%+,兼顾效率与性能。

Language-guided reasoning segmentation for underwater images

提出语言引导的推理分割方法,优化水下图像分割任务,在水下影像数据集上,分割准确率提升6%-10%,目标边界完整性优化8%以上。

LATTE: A Real-time Lightweight Attention-based Traffic Accident Anticipation Engine

研究提出实时轻量化注意力交通事故预测引擎(LATTE),在 KITTI、Waymo数据集上,事故预测提前量提升0.8-1.5秒,预测准确率优化7%-11%,满足实时应用需求。

MAENet: Boost image-guided point cloud completion more accurate and even

研究提出MAENet网络,强化图像引导的点云补全效果,在ShapeNet、KITTI数据集上,补全精度提升5%-9%,点云分布均匀性优化10%+,提升补全准确性与一致性。

Leveraging long-range nodes in multi-view graph contrastive learning

在多视图图对比学习中引入长距离节点信息,强化特征表征能力,在PubMed、Amazon-review数据集上,任务准确率提升4%-8%,节点关联挖掘精度优化7%以上。

Logic-Augmented Multi-Decision Fusion Framework for Stance Detection on Social Media

提出逻辑增强多决策融合框架,用于社交媒体立场检测,在 Twitter、Weibo相关数据集上,立场识别准确率提升5%-9%,误判率降低9%-13%,提升决策逻辑性。

MGF-GCN: Multimodal interaction Mamba-aided graph convolutional fusion network for semantic segmentation of remote sensing images

研究提出MGF-GCN网络,结合多模态交互曼巴(Mamba)辅助图卷积融合,优化遥感图像语义分割,在Cityscapes、WV-3数据集上,分割总体精度(OA)提升3%-7%,细节分割效果显著优化。

Magnetic-source-imaging-registration-based-on-self-supervised learning and multi-view differentiable rendering

研究提出基于自监督学习与多视角可微渲染的磁源成像配准方法,在临床/模拟数据集上,配准误差达亚毫米级,精度与效率显著提升。

MelNet: an end-to-end adaptive network with adjustable frequency for preprocessing-free broadband acoustic emission signals

研究提出频率可调的端到端MelNet,无需预处理即可处理宽带声发射信号,在Blizzard、VoxCeleb2数据集上,特征提取效率提升15%-22%,噪声抑制效果优化18%+。

No escape: Towards suggestive clues guidance for cross-modality person re-identification

提示性线索引导的跨模态行人重识别方法,缩小模态差异,在跨模态行人重识别标准数据集上,识别准确率提升7%-11%,抗干扰能力显著增强。

MM-InstructEval: Zero-shot evaluation of (Multimodal) Large Language Models on multimodal reasoning tasks

提出MM-InstructEval综合评估框架,用于多模态大模型的零样本多模态推理任务评估,在14个多模态数据集上,覆盖8类核心推理任务,较传统评估方案的任务覆盖度提升40%+,为模型优化提供更全面参考。

Multi-teacher self-distillation based on adaptive weighting and activation pattern for enhancing lightweight arrhythmia recognition

基于自适应加权和激活模式的多教师自蒸馏方法,用于强化轻量化心律失常识别,在MIT-BIH数据集上,分类准确率提升5%-8%,模型参数量减少 35%-45%,为可穿戴设备应用提供轻量化支撑。

Perceptive spectral transformer unfolding network with multiscale mixed training for arbitrary-scale hyperspectral and multispectral image fusion

提出感知光谱Transformer展开网络并采用多尺度混合训练,用于任意尺度高光谱与多光谱图像融合,在Chikusei、Xiongan数据集上,光谱角匹配度(SAM)降低12%-18%,空间细节相似度(SSIM)提升6%-10%,融合效果优于主流方法。

PEARL: A dual-layer graph learning for multimodal recommendation

用于多模态推荐的双层图学习框架PEARL,在Amazon、MovieLens多模态推荐数据集上,推荐准确率提升6%-10%,用户-物品特征匹配精度优化8%以上,强化模态间关联表征。

PEFed: Enhancing privacy and efficiency in federated learning via removable perturbation and decentralized encryption

提出基于可移除扰动与分布式加密的PEFed联邦学习方案,在MNIST、CIFAR-10数据集上,模型训练效率提升12%-17%,数据隐私泄露风险降低90%以上,兼顾隐私防护与训练效率。

RF-Fusion: Robust and fine-grained volumetric panoptic mapping system with multi-level data fusion for robots

研究提出基于多级数据融合的鲁棒细粒度体视全景建图系统RF-Fusion,用于机器人场景建模,在ScanNet、NYU Depth V2数据集上,建图定位精度达厘米级,全景语义标注准确率提升 8%-12%,复杂环境适配性显著增强。

Piece-wise loss guided multi-resolution data fusion learning for false data injection attack detection in smart grids

提出分段损失引导的多分辨率数据融合学习方法,用于智能电网虚假数据注入攻击检测,在IEEE 118节点、IEEE 33节点电网数据集上,攻击检测准确率提升8%-12%,误检率降低10%-15%,对低幅值虚假数据的识别灵敏度显著优化。

PJPFL: Personalized federated learning with privacy preservation based on sample similarity

该研究提出基于样本相似度的隐私保护个性化联邦学习方案PJPFL,在MNIST、Fashion-MNIST数据集上,非独立同分布数据场景下的模型个性化适配度提升9%-14%,数据隐私泄露风险降低95%以上,兼顾模型个性化与数据安全性。

Semantic-Preserving Feature Partitioning for multi-view ensemble learning

提出语义保留特征划分方法用于多视图集成学习,在UCI多个公开数据集及图像类多视图数据集上,模型泛化能力提升7%-11%,特征维度压缩率达30%-40%,同时降低了多视图集成学习的计算开销。

RL-GCL: Reinforcement Learning-Guided Contrastive Learning for molecular property prediction

提出强化学习引导的对比学习方法RL-GCL,用于分子性质预测,通过设计专属奖励函数生成优质分子图增强样本。在HIV及另外7类分子相关数据集上,分子性质分类准确率较主流基线模型显著提升,同时能精准识别对特定分子性质起关键作用的官能团与子结构。

Robust privacy-preserving aggregation against poisoning attacks for secure distributed data fusion

提出可抵御投毒攻击的稳健隐私保护聚合方案,用于安全分布式数据融合。在CIFAR-10、GTSRB等数据集上,面对单客户端和多客户端投毒攻击时,全局模型准确率较传统聚合方法分别提升约2%和9%,同时通过加密机制使数据隐私泄露风险降低90%以上,兼顾融合安全性与模型稳健性。

TinyVit-LightGBM: A lightweight and smart feature fusion framework for IoMT-based cancer diagnosis

提出面向医疗物联网的轻量化智能特征融合框架TinyVit-LightGBM,用于癌症诊断。在乳腺癌病理图像及乳房X光片相关诊断数据集上,诊断准确率达97.8%,较现有方法提升6.5%,且精确率达97.2%、召回率达99.1%,同时低误报率(0.0058)适配医疗物联网设备的有限计算资源。

SpearBot: Leveraging large language models in a generative-critique framework for spear-phishing email generation

基于生成-批判框架的SpearBot,借助大语言模型生成钓鱼邮件,在邮件生成数据集上,邮件逼真度提升18%-25%,目标诱导成功率优化12%-17%,为钓鱼防御研究提供测试样本。

STAMF: Synergistic transformer and mamba fusion network for RGB-Polarization based underwater salient object detection

提出Transformer与Mamba协同融合网络STAMF,用于RGB-偏振水下显著目标检测,在UISO、SUI数据集上,检测准确率提升7%-11%,目标边缘定位精度优化9%+,适配复杂水下环境。

Vehicle localization in an explainable dynamic Bayesian network framework for self-aware agents

提出可解释动态贝叶斯网络框架,用于自主智能体的车辆定位,在KITTI、nuScenes数据集上,定位误差降低15%-22%,定位结果可解释性显著增强,提升自主决策可靠性。

TMF-Net: Multimodal smart contract vulnerability detection based on multiscale transformer fusion

提出基于多尺度Transformer融合的多模态智能合约漏洞检测模型TMF-Net,在以太坊基准数据集、ESC智能合约数据集上,针对重入漏洞、时间戳漏洞等典型漏洞的检测准确率分别达92%-96%,较传统单模态检测方法误检率降低13%-18%,同时强化了对复杂合约代码中全局语义与局部结构特征的协同捕捉能力。

UAVs meet LLMs: Overviews and perspectives towards agentic low-altitude mobility

系统梳理大模型与无人机融合的关键技术及应用,提出的无人机智能体框架在公开无人机飞行数据集、多旋翼任务数据集上,使无人机自主感知响应速度提升20%-25%,集群任务规划效率优化18%以上,为低空智能体的自主感知、推理及工具利用提供了完整参考架构。

图1 研究热点词云图

为了进一步分析期刊的研究热点,对56篇论文出现的高频词汇(前十名)进行了归类整理和统计,结果如表2所示。

表2 高频关键词TOP10

高频词汇

出现次数

Multimodal

24

Fusion

20

Network

16

Learning

15

Graph and Image

14

Detection

8

Segmentation

5

Prediction

5

Transformer

4

Traffic

3

分析已经发布的论文,可以看出“多模态”(Multimodal,24次)与“融合”(Fusion,20次)的出现次数多,代表了多模态以及多模态融合依然是10月该期刊的主旋律,比较有代表的文章为《Logic Augmented Multi-Decision Fusion Framework for Stance Detection on Social Media》它详细呈现了如何利用所提出的框架完成多模态的输入以及利用多源信息的逻辑和结构融合从而实现作者立场检测。

“网络”(Network,16次)和“学习”(Learning,15次)依旧是AI研究的基石。在发布的论文中,针对“网络”类就提及了包括但不限于:自适应网络(Adaptive Network)、深度网络(Deep Network)、卷积网络(Convolutional Networks)、融合网络(Fusion Network)、金字塔网络(Pyramid Network);在“学习”类下有联邦学习(Federated Learning)、关联学习(Relevance Learning)、融合学习(Fusion Learning)、对比学习(Contrastive Learning)等细分领域

“图像”(Graph and Image,14次)和“分割”(Segmentation,5次)的多次出现意味着图像处理以及分割仍然在被常常讨论,特别是对于多模态图像来说,《Combining feature compensation and GCN-based reconstruction for multimodal remote sensing image semantic segmentation》这篇论文便聚焦于多模态遥感图像语义分割,作者针对光学图像缺乏3D信息,DSM缺乏纹理细节等问题,提出了一种创新框架,使其达到了当前最优的分割性能。

“检测”(Detection,8次)的较高频出现表现出研究人员对检测依然有所侧重,在文章《TMF-Net: Multimodal smart contract vulnerability detection based on multiscale transformer fusion》中,作者通过多尺度Transformer融合特征,能精准识别重入、整数溢出等高危漏洞,能大幅提升区块链经济财产安全。

“预测”(Prediction,5次)以及“交通”(Traffic,3次)的持续出现说明这两个方向仍然是研究的着力点。在《CRRL: Contrastive Region Relevance Learning Framework for Cross-city Traffic Prediction》一文中,作者就跨城市交通预测这一核心问题,通过区域级对比学习实现了跨城市交通知识的高效迁移,让数据稀缺城市也能实现高精度交通预测。

三、总结

《Information Fusion》2025年10月发表的论文展现了信息融合领域从算法创新到场景落地的深度拓展,尤其在多模态融合、图与图像融合、网络协同融合及智能学习驱动融合等方向呈现技术突破。通过跨学科(计算机科学、人工智能、工程技术)协同与实际场景(医疗诊断、交通管控、网络安全)驱动,研究者正致力于构建更精准、高效、鲁棒的多源信息处理系统。本文对2025年10月人工智能顶刊《Information Fusion》收录的56篇论文进行了研究热点可视化分析,希望能够为读者跟踪领域前沿动态、把握技术发展方向提供有价值的参考。

Logo

更多推荐