
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文提出地理定位推理新任务,要求模型通过视觉语义推理图像拍摄位置。构建了SeekWorld数据集,包含: Train-Clue-Tracking:带详细推理过程的视觉线索追踪数据; Train-No-Process:常规样本数据。基于Qwen2.5-7B-VL-Instruct模型,利用强化学习训练出专用视觉地理定位模型SeekWord-7B。该研究旨在提升模型对图像隐含地理信息的推理能力。
摘要:文章探讨了LLM作为智能代理的应用与挑战。在RL时代需人工设定奖励函数,而LLM代理直接利用文本交互实现任务,包括观察环境、生成动作(需文本到实际动作的转换),并可通过调用工具扩展能力。研究案例显示,LLM能模拟人类行为(GenerativeAgents)和自动数据科学(AutoKaggle)。行为调整方面,通过修改输入(如报错信息)而非训练模型参数来优化输出,并引入记忆管理与反思机制(如R

LLM 生成的 POI 中未能与地图服务匹配的比例,评估 LLM 输出信息的准确性。:在生成行程中成功命中的真实行程中的 POI 占比,衡量系统理解用户请求和推荐个性化 POI 的准确性。:生成行程的总距离与通过 TSP 求得最短路径之间的平均差距(每个 POI),衡量空间优化质量。:生成路径中的自交点数量,OL 与 AM 一起衡量 POI 访问顺序的空间合理性,值越小越好。:涉及不断变化的 PO

NeurIPS 2024论文提出了一种基于大语言模型(LLM)的框架Mobility-LLM,旨在深入挖掘签到序列中的语义信息,以全面理解用户的访问意图和出行偏好。现有方法多局限于特定任务,如位置或时间预测,而Mobility-LLM通过预训练的LLM,能够从签到序列中有效提取语义,捕捉用户的短期访问意图和长期出行偏好。论文提出了访问意图记忆网络(VIMN)和人类偏好的共享提示(HTPP),分别用

《AgentMove:基于大语言模型的广义移动性预测智能体框架》摘要 针对现有深度学习模型在位置预测中的局限性(数据依赖性强、零样本能力弱、常识理解不足),本文提出首个基于LLM的智能体框架AgentMove。系统包含三大模块:1)时空记忆模块存储轨迹模式,2)外部知识模块整合地理信息,3)推理模块模拟人类决策过程。该框架创新地将智能体架构引入移动预测领域,通过模块化设计克服了传统LLM方法在轨迹
摘要:针对轨迹数据获取成本高和隐私问题,本文提出基于大语言模型(LLM)的Geo-Llama框架,用于生成满足时空约束的合成轨迹数据。传统方法存在参数配置复杂、控制能力不足等问题。Geo-Llama将轨迹表示为token序列,通过微调LLM实现可控生成。实验在GeoLife和MobilitySyn数据集上进行,比较了固定时间间隔和访问序列两种表示方式。评估显示,该方法能有效处理访问约束,生成更真实

近年来,对比学习(contrastive learning)作为一种提取有意义数据表示的有前景范式,受到了广泛关注。,已被证明能够显著提升对比学习的性能。然而,尽管这一策略在实践中非常成功,其背后的作用机制。出发,对投影头的本质进行了深入的理论研究。我们建立了一个理论框架,能够对。我们相信,这一对投影头作用的理论理解,将为未来在对比学习中的。,以提升其对无关信息的过滤能力。基于上述理论洞察,我们提

摘要:本文提出了一种新的多视图区域嵌入一致性学习框架ReCP,突破了传统"单视图表示+多视图融合"范式的局限性。ReCP通过视图内对比学习和自动编码器捕获视图特有特征,同时创新性地设计了视图间对比学习和双重预测机制,有效利用多视图间的信息一致性作为学习约束,实现知识跨视图迁移。该方法在AAAI2024会议上展示,实验验证了其有效性。

θB-θ:任务B上额外获得的能力,直接加到θA上即可但参数是加加减减的东西吗?LLM时代好像是的新模型同时有A和B能力的模型了,前提是A和B是从一个foundation mode里来的反向相减,就能失去B的能力,也即unlearning假设有ABC,而且知道D相对于C就是B相对于A的关系那么即使没有D的资料,也可以获得D的能力比如我们有一个基本的语音辨识系统ASR,和一个一般人听不懂的、有文字资料









