
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
联合嵌入预测架构(JEPA)常被视为基于似然的自监督学习的非生成式替代方法,其核心是在表示空间中进行预测,而非在观测空间中做重构。本文提出,这种与概率生成建模的割裂大多是表述层面的,而非结构层面的:标准 JEPA 的设计 —— 耦合编码器与上下文到目标的预测器 —— 与对一类耦合隐变量模型做变分推断得到的变分后验、学习到的条件先验高度吻合;标准 JEPA 可被看作一种确定性特例,其正则化依赖架构与

让机器人在多样环境中执行各类任务,是机器人学习领域的核心挑战。尽管视觉 - 语言 - 动作(VLA)模型在通用机器人技能学习中展现出潜力,但要充分发挥其能力,仍需解决动作表示与高效训练方面的局限。当前 VLA 模型往往聚焦于视觉 - 语言模型(VLM)组件的规模扩展,而动作空间表示仍是关键瓶颈。本文提出DexVLA框架,旨在提升 VLA 模型在跨多机器人本体、复杂长时域任务中的效率与泛化能力。De

近期潜在世界模型(如 V-JEPA2)在从视频观测预测未来世界状态方面展现出可观能力。然而,基于短观测窗口的稠密预测会限制时序上下文,并使预测器偏向局部、低层次的外推,难以捕捉长时程语义,降低下游任务实用性。相比之下,视觉 - 语言模型(VLM)通过对均匀采样帧进行推理,具备强大的语义锚定与通用知识建模能力,但因计算驱动的稀疏采样、语言输出瓶颈(将细粒度交互状态压缩为文本导向表示),以及适配小样本

联合嵌入预测架构(JEPA)为在紧凑隐空间中学习世界模型提供了极具潜力的框架,但现有方法仍不稳定,需依赖复杂的多损失项、指数移动平均、预训练编码器或辅助监督来避免表征坍缩。本文提出,首个仅用即可从原始像素端到端稳定训练的 JEPA:下一时刻嵌入预测损失,以及强制隐嵌入服从高斯分布的正则项。与现有唯一端到端方案相比,可训练损失超参数从 6 个降至 1 个。LeWM 仅 1500 万参数,单 GPU

人工智能在预测科学属性方面展现出卓越能力,然而科学发现本质上仍是一项受实验周期支配、具有物理性和长时程特征的探索工作。当前大多数计算方法与这一现实脱节,将发现视为孤立的、面向特定任务的预测,而非与物理世界的持续交互。本文提出具身科学这一范式,将科学发现重构为智能体化推理与物理执行紧密耦合的闭合循环。我们设计了统一的感知 - 语言 - 行动 - 发现(PLAD)框架,具身智能体通过该框架感知实验环境

人工智能在预测科学属性方面展现出卓越能力,然而科学发现本质上仍是一项受实验周期支配、具有物理性和长时程特征的探索工作。当前大多数计算方法与这一现实脱节,将发现视为孤立的、面向特定任务的预测,而非与物理世界的持续交互。本文提出具身科学这一范式,将科学发现重构为智能体化推理与物理执行紧密耦合的闭合循环。我们设计了统一的感知 - 语言 - 行动 - 发现(PLAD)框架,具身智能体通过该框架感知实验环境

传统模型直接从图像+语言指令预测动作,擅长语义理解,但对物理动态(如物体碰撞、摩擦、变形)的泛化能力较弱。世界模型则通过学习“未来预测”来弥补这一短板:它模拟环境如何随动作变化,从而支持规划、策略学习和零样本泛化。AC-WM(动作条件世界模型):传统世界模型的代表形式。WAM(世界动作模型):新兴统一框架,将“世界预测”和“动作生成”深度融合,常基于大规模预训练视频扩散模型。两者都源于视频生成技术

传统模型直接从图像+语言指令预测动作,擅长语义理解,但对物理动态(如物体碰撞、摩擦、变形)的泛化能力较弱。世界模型则通过学习“未来预测”来弥补这一短板:它模拟环境如何随动作变化,从而支持规划、策略学习和零样本泛化。AC-WM(动作条件世界模型):传统世界模型的代表形式。WAM(世界动作模型):新兴统一框架,将“世界预测”和“动作生成”深度融合,常基于大规模预训练视频扩散模型。两者都源于视频生成技术

在人工智能(AI)的发展史上,“具身智能”(Embodied AI)正成为最引人注目的前沿范式。它不再是单纯的“数字大脑”,而是将智能赋予一个拥有“身体”的实体——机器人、无人机或人形机械臂——使其能够在物理世界中感知、理解、规划并执行任务。不同于传统AI仅在虚拟环境中处理数据,具身智能强调感知-决策-行动的闭环:通过与真实环境的交互,智能体不断学习、适应,并最终实现开放世界的通用能力。

在人工智能(AI)的发展史上,“具身智能”(Embodied AI)正成为最引人注目的前沿范式。它不再是单纯的“数字大脑”,而是将智能赋予一个拥有“身体”的实体——机器人、无人机或人形机械臂——使其能够在物理世界中感知、理解、规划并执行任务。不同于传统AI仅在虚拟环境中处理数据,具身智能强调感知-决策-行动的闭环:通过与真实环境的交互,智能体不断学习、适应,并最终实现开放世界的通用能力。








