
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
25年12月来自韩国首尔大学和RLWRLD.AI的论文“Dexterous World Models”。近年来,3D重建技术的进步使得从日常环境中创建逼真的数字孪生变得更加容易。然而,目前的数字孪生模型大多是静态的——仅限于导航和视图合成,缺乏具身交互能力。为了弥合这一差距,引入灵巧世界模型(Dexterous World Model,DWM),这是一个基于场景-动作条件的视频扩散框架,用于建模灵

25年10月来自York大学的论文“Rise of the Robochemist”。化学作为一门历史悠久的学科,历来依赖于人工操作,且耗时较长。尽管目前已有一些自动化技术,但随着机器人技术和人工智能(AI)的融合,化学领域正处于一场重大变革的开端,由此催生了“机器人化学家”的概念:一种全新的范式,即利用自主系统辅助设计、执行和分析实验。机器人化学家整合移动机械臂、先进的感知技术、远程操控和数据驱

25年1月来自IEEE ICRA'24研讨会的论文“Accelerating Discovery in Natural Science Laboratories with AI and Robotics: Perspectives and Challenges from the 2024 IEEE ICRA Workshop, Yokohama, Japan”。科学实验室自动化能够加速生命科学和材

25年10月来自原力灵机(Dexmal/Dexbotic)公司和阶跃(StepFun)公司的论文"Running VLAs at Real-time Speed"。本文展示如何使用单个消费级GPU以30Hz帧率和最高480Hz轨迹频率运行π0级多视角VLA模型。这使得以往大型VLA模型无法完成的动态和实时任务成为可能。为了实现这一目标,引入一系列战略来消除模型推理中的开销。实际实验表明,采用该战略

25年7月来自中科院自动化所、理想汽车、鹏程实验室、新加坡国立大学和清华大学的论文“World4Drive: End-to-End Autonomous Driving via Intention-aware Physical Latent World Model”。端到端自动驾驶直接从原始传感器数据生成规划轨迹,但它通常依赖于昂贵的感知监督来提取场景信息。一个关键的研究挑战是:构建一个信息丰富的

25年10月来自极佳公司的论文“GigaBrain-0: A World Model-Powered Vision-Language- Action Model”。训练通用机器人的视觉-语言-动作(VLA)模型通常需要大规模的真实世界机器人数据,而收集这些数据既昂贵又耗时。物理数据收集的低效严重限制了当前VLA系统的可扩展性和泛化能力。为了应对这一挑战,本文提出了GigaBrain-0,一种新型的

25年8月来自昆仑万维(Skywork AI)的论文“Matrix-Game 2.0: An Open-Source, Real-Time, and Streaming Interactive World Model”。交互式视频生成领域的最新进展证明,扩散模型通过捕捉复杂的物理动态和交互行为作为世界模型的潜力。然而,现有的交互式世界模型依赖于双向注意和冗长的推理步骤,严重限制了实时性能。因此,它

25年5月来自北京大学和北京智源的论文“RoboOS: A Hierarchical Embodied Framework for Cross-Embodiment and Multi-Agent Collaboration”。具身智能的兴起,为下一代工业生态系统带来前所未有的挑战,即需要具备韧性、认知驱动的多智体协作,从而彻底改变自主制造、自适应服务机器人和信息物理融合生产架构的范式。然而,当前

25年10月来自AI工业研究院(AIR)、清华、上海AI实验室和北大的论文“X-VLA: Soft-Prompted Transformer as Scalable Cross-Embodiment Vision-Language-Action Model”。成功的通用型“视觉-语言-动作”(VLA)模型依赖于跨多种机器人平台的有效训练,以及大规模、跨具身、异构的数据集。为了促进并充分利用丰富多样

25年5月来自西湖大学、浙大、西安交大和香港科大广州分校的论文“OPENHELIX: A Short Survey, Empirical Analysis, and Open-Source Dual-System VLA Model for Robotic Manipulation”。双-系统 VLA(视觉-语言-动作)架构已成为具身智能研究的热点,但目前尚缺乏足够的开源工作来进一步进行性能分析和








