AI模块工坊个人主页

@2501_92747663

AI模块工坊

2025-09-17 15:15:24 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

即插即用还涨点！ICCV 2025 LEG：边缘-高斯-双注意力，非常涨点的三重增强轻量模块，显著提升视觉任务性能

遥感图像目标检测（）任务常受到低空间分辨率、传感器噪声、运动模糊及不利光照等多重降质因素的困扰。这些因素削弱了目标的特征独特性，导致表示模糊和前景-背景分离困难。现有方法，特别是轻量化模型，在处理低质量目标时表现出局限性。为应对这些挑战，本文提出了一种名为的轻量级骨干网络，其核心是新颖的来锐化模糊或低对比度目标中易于丢失的关键边缘细节，并利用来抑制噪声、规整模糊的特征响应，从而在挑战性条件下增强前

#计算机视觉

SCI一区，即插即用！SCSA协同注意力机制：小目标检测与低光照增强的通用涨点方案

现有研究虽已证明通道与空间注意力的结合能提升视觉任务性能，但两者间的，特别是在空间信息如何指导通道特征学习以及如何缓解多语义信息带来的差异方面，仍缺乏深入探讨。现有即插即用注意力机制普遍存在两大局限：一是对固有的多语义空间信息利用不足，无法有效引导关键特征提取；二是对多语义融合带来的处理不当。为应对这些挑战，本文提出了一种新颖的）模块。该方法旨在探索空间与通道注意力在多语义层面的协同关系。SCSA

#目标检测 #人工智能 #计算机视觉

【NeurIPS 25】即插即用，破解LLM推理两大难题，难度偏差与熵崩塌迎刃而解

本文通过对 GRPO 的深刻洞察，提出了一个更具原则性的判别式约束优化框架 DisCO。该框架不仅从根本上解决了 GRPO 的“难题偏见”，还通过一系列精心设计的技术（如非裁剪评分函数、约束优化、DRO）成功克服了现有方法的训练不稳定和数据不平衡问题，最终在多个数学推理基准上实现了显著的性能飞跃，为强化学习优化大型推理模型提供了新的SOTA方法。个人思考 (My Thoughts):研究思路的启发

【CVPR 2025】即插即用EfficientViM：新架构让视觉Mamba快得离谱，速度精度双碾压！

为了在资源受限的环境中部署神经网络，以往的研究通过结合卷积（捕获局部依赖）和注意力机制（捕获全局依赖）来构建轻量级架构。然而，注意力机制的二次方计算复杂度成为其效率瓶颈。近期，**状态空间模型（State Space Model, SSM）**因其在处理长序列时具有线性计算复杂度的优势而备受关注。尽管如此，现有的视觉Mamba模型在实际应用中速度仍不及顶尖的轻量级模型，其主要瓶颈在于对输入序列的线

#架构 #计算机视觉

即插即用，涨点神器！AAAI 2026模块MHCB+DPA：特征提取+双池化注意力，无需魔改结构，性能显著提升

遥感图像在军事、资源勘探等领域应用广泛，但单一传感器难以同时获取高空间分辨率和高光谱分辨率的图像。全色（PAN）图像空间分辨率高但为灰度，多光谱（MS）图像色彩丰富但空间分辨率低。现有方法通常将图像**超分辨率（Super-Resolution, SR）**与图像着色作为独立任务处理，前者无法提升光谱信息，后者无法提升空间细节，而全色锐化等融合方法又需要配准的图像对作为输入。为解决这一困境，本文提

即插即用！AAAI 2025 DDI模块发布，双MLP实现跨尺度信息融合

时间序列预测（Time Series Forecasting, TSF）领域的主流方法，如基于Transformer和MLP的模型，在处理现实世界中复杂的时间序列数据时面临各自的挑战。真实世界的时间序列通常在不同尺度上展现出多样的模式，而未来的变化正是由这些重叠尺度的相互作用共同决定的。Transformer模型虽擅长捕捉长程依赖，但计算复杂度高且易过拟合；MLP模型虽计算高效，却难以有效捕获复杂

#人工智能

【AAAI 2026 Oral】告别单一路径，即插即用LWGA模型，提出四种注意力并行新机制，多尺度特征捕捉能力拉满

遥感（RS）图像分析的效率受到两大冗余问题的制约：一是广阔同质背景导致的（spatial redundancy），二是目标尺度极端变化导致的现有的轻量化网络模型多为自然图像设计，难以同时应对遥感图像的这两个挑战，常常在保留局部细节和捕捉全局上下文之间顾此失彼。为解决此问题，本文提出了一个专为遥感视觉任务设计的轻量级骨干网络——LWGANet。该网络通过两个核心创新应对上述挑战：1）Top-K全局特

【ICCV 2025】即插即用合成图表数据集ECD问世，开源MLLM图表理解性能飙升！

图表理解是构建有效科学智能体的核心，然而现有的，特别是开源模型，在复杂基准测试上的成功率仅为30%-50%，表现不佳。现有研究通过合成图表数据对模型进行微调，但这些数据与真实图表的相似度不足，限制了模型在复杂真实场景下的性能。为应对此挑战，本文提出了一种高效的图表数据合成方法。该方法将图表生成过程模块化，通过一个五步流水线设计——分离数据与绘图函数、条件化生成多子图、视觉多样化、质量过滤及问答对生

#计算机视觉

告别冗余！AAAI 2025 HFP模块：即插即用的双路DCT设计，在多个任务上实现SOTA

其设计灵感来源于传统图像处理：微小目标的边缘、纹理等细节信息主要对应频域中的高频分量，而大面积的平滑背景则对应低频分量。从图4可以看出，原始特征图（左）中，微小目标的响应非常微弱，几乎淹没在背景中。经过HFP模块处理后（右），目标的特征响应被显著增强，轮廓更加清晰，与背景的区分度也更高。HS-FPN的整体结构与FPN相似，保留了自底向上和自顶向下的双路径设计。SDP通过在局部区域内精确匹配高低层特

#人工智能

【AAAI 2025】卷积与Transformer大一统！M-WSAttention让图像恢复效果焕然一新

在自监督图像去噪（SSID）领域，盲点网络（Blind-Spot Network, BSN）是一种主流架构。然而，现有BSN多基于卷积（CNN）实现，其在捕获长距离依赖方面存在固有局限。尽管Transformer在多种图像恢复任务中展现了超越CNN的潜力，但其核心的自注意力机制可能与BSN严格的“盲点约束”相冲突，导致模型直接“看到”并学习输入噪声，从而限制了其在SSID中的应用。本文系统性地分析

#transformer #人工智能

共 11 条

请选择