logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Relation-R1 简读:让多模态大模型真正理解“关系”

在 SWiG 数据集上,Relation-R1 面向 grounded situation recognition,也就是更复杂的 N 元关系理解任务,在 Verb、Value、Grounded Value 等指标上都取得了较好的表现,尤其在 Grnd-all 指标上相比之前方法提升明显。对于 N 元关系,则先判断主要动作,再识别参与实体及其语义角色,最后定位这些实体。它的启发在于,多模态大模型要

#AIGC#人工智能#机器学习
遥感 VLM 还能靠 Prompt 提升?一篇面向遥感VLM 的 Prompt Optimization 论文快报

整体来看,这是一篇比较轻量但有参考价值的论文。它证明了 prompt optimization 在遥感 VLM 中确实有作用,尤其适合用于图像描述、区域理解和复杂场景分析任务。如果大家也正在做遥感多模态大模型,尤其是数据构造、指令设计或者 SFT 样本设计,这篇论文值得快速阅读。它不一定能提供很强的模型创新启发,但能帮助我们更好地理解:遥感大模型训练中,prompt 和 instruction 的

#人工智能#机器学习#计算机视觉
蚂蚁+武大ICCV 2025 | SkySense V2:统一多模态遥感基础模型

将多模态遥感问题统一为“共享表征 + 语义对齐”的建模问题。QSACLMoE构建了一套完整的多模态遥感基础模型范式。这一思路对于后续遥感大模型的发展,具有较强的参考价值。

#AIGC#经验分享
蚂蚁+武大ICCV 2025 | SkySense V2:统一多模态遥感基础模型

将多模态遥感问题统一为“共享表征 + 语义对齐”的建模问题。QSACLMoE构建了一套完整的多模态遥感基础模型范式。这一思路对于后续遥感大模型的发展,具有较强的参考价值。

#AIGC#经验分享
最新综述 | 遥感中的基础模型:从单模态到多模态的演进

随着遥感数据量和多样性的指数级增长,传统模型已难以应对高维、多源数据处理的挑战。本文对遥感领域的基础模型进行了全面的技术综述,首次从单模态到多模态演进的全新视角切入。文章不仅回答了什么是遥感大模型、为什么需要它们,还为初学者提供了一套从预训练到下游任务微调的实操指南。

#AIGC#经验分享
NeurIPS 2025 | 人大: MokA——打破多模态微调僵局,实现参数高效的跨模态深度对齐的新范式

题目: MokA: Multimodal Low-Rank Adaptation for MLLMS。后续可尝试在微调大模型时尝试使用该方法,以提升baseline,体现论文之“新”。项目主页:[https://gewu-lab.github.io/MokA]单位:中国人民大学、北京市大模型与智能治理重点实验室等。

#AIGC#经验分享
最新论文 | 中科大: 遥感大模型的“破壁人”:RS-RAG 如何让卫星影像学会“查资料”?

题目: Remote Sensing Retrieval-Augmented Generation: Bridging Remote Sensing Imagery and Comprehensive Knowledge with a Multi-Modal Dataset and Retrieval-Augmented Generation Model论文: arXiv:2504.04988v2

#AIGC#经验分享
到底了