pottttt7 个人主页

@pottttt7

pottttt7

2025-07-18 19:28:02 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Relation-R1 简读：让多模态大模型真正理解“关系”

在 SWiG 数据集上，Relation-R1 面向 grounded situation recognition，也就是更复杂的 N 元关系理解任务，在 Verb、Value、Grounded Value 等指标上都取得了较好的表现，尤其在 Grnd-all 指标上相比之前方法提升明显。对于 N 元关系，则先判断主要动作，再识别参与实体及其语义角色，最后定位这些实体。它的启发在于，多模态大模型要

#AIGC #人工智能 #机器学习

遥感 VLM 还能靠 Prompt 提升？一篇面向遥感VLM 的 Prompt Optimization 论文快报

整体来看，这是一篇比较轻量但有参考价值的论文。它证明了 prompt optimization 在遥感 VLM 中确实有作用，尤其适合用于图像描述、区域理解和复杂场景分析任务。如果大家也正在做遥感多模态大模型，尤其是数据构造、指令设计或者 SFT 样本设计，这篇论文值得快速阅读。它不一定能提供很强的模型创新启发，但能帮助我们更好地理解：遥感大模型训练中，prompt 和 instruction 的

#人工智能 #机器学习 #计算机视觉

蚂蚁+武大ICCV 2025 | SkySense V2：统一多模态遥感基础模型

将多模态遥感问题统一为“共享表征 + 语义对齐”的建模问题。QSACLMoE构建了一套完整的多模态遥感基础模型范式。这一思路对于后续遥感大模型的发展，具有较强的参考价值。

#AIGC #经验分享

蚂蚁+武大ICCV 2025 | SkySense V2：统一多模态遥感基础模型

#AIGC #经验分享

最新综述 | 遥感中的基础模型：从单模态到多模态的演进

随着遥感数据量和多样性的指数级增长，传统模型已难以应对高维、多源数据处理的挑战。本文对遥感领域的基础模型进行了全面的技术综述，首次从单模态到多模态演进的全新视角切入。文章不仅回答了什么是遥感大模型、为什么需要它们，还为初学者提供了一套从预训练到下游任务微调的实操指南。

#AIGC #经验分享

NeurIPS 2025 | 人大: MokA——打破多模态微调僵局，实现参数高效的跨模态深度对齐的新范式

题目: MokA: Multimodal Low-Rank Adaptation for MLLMS。后续可尝试在微调大模型时尝试使用该方法，以提升baseline，体现论文之“新”。项目主页：[https://gewu-lab.github.io/MokA]单位:中国人民大学、北京市大模型与智能治理重点实验室等。

#AIGC #经验分享

题目: Remote Sensing Retrieval-Augmented Generation: Bridging Remote Sensing Imagery and Comprehensive Knowledge with a Multi-Modal Dataset and Retrieval-Augmented Generation Model论文: arXiv:2504.04988v2

#AIGC #经验分享

到底了