
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在 SWiG 数据集上,Relation-R1 面向 grounded situation recognition,也就是更复杂的 N 元关系理解任务,在 Verb、Value、Grounded Value 等指标上都取得了较好的表现,尤其在 Grnd-all 指标上相比之前方法提升明显。对于 N 元关系,则先判断主要动作,再识别参与实体及其语义角色,最后定位这些实体。它的启发在于,多模态大模型要
整体来看,这是一篇比较轻量但有参考价值的论文。它证明了 prompt optimization 在遥感 VLM 中确实有作用,尤其适合用于图像描述、区域理解和复杂场景分析任务。如果大家也正在做遥感多模态大模型,尤其是数据构造、指令设计或者 SFT 样本设计,这篇论文值得快速阅读。它不一定能提供很强的模型创新启发,但能帮助我们更好地理解:遥感大模型训练中,prompt 和 instruction 的
将多模态遥感问题统一为“共享表征 + 语义对齐”的建模问题。QSACLMoE构建了一套完整的多模态遥感基础模型范式。这一思路对于后续遥感大模型的发展,具有较强的参考价值。
将多模态遥感问题统一为“共享表征 + 语义对齐”的建模问题。QSACLMoE构建了一套完整的多模态遥感基础模型范式。这一思路对于后续遥感大模型的发展,具有较强的参考价值。
随着遥感数据量和多样性的指数级增长,传统模型已难以应对高维、多源数据处理的挑战。本文对遥感领域的基础模型进行了全面的技术综述,首次从单模态到多模态演进的全新视角切入。文章不仅回答了什么是遥感大模型、为什么需要它们,还为初学者提供了一套从预训练到下游任务微调的实操指南。
题目: MokA: Multimodal Low-Rank Adaptation for MLLMS。后续可尝试在微调大模型时尝试使用该方法,以提升baseline,体现论文之“新”。项目主页:[https://gewu-lab.github.io/MokA]单位:中国人民大学、北京市大模型与智能治理重点实验室等。
题目: Remote Sensing Retrieval-Augmented Generation: Bridging Remote Sensing Imagery and Comprehensive Knowledge with a Multi-Modal Dataset and Retrieval-Augmented Generation Model论文: arXiv:2504.04988v2







