
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文提出BifrostUMI框架,通过低成本VR-UMI接口采集人类全身演示数据,并采用分层控制策略实现人形机器人全身技能迁移。系统包含:1)无机器人数据采集系统,记录人类关键点轨迹和腕部视觉;2)高层扩散策略预测5个关键点相对位姿;3)空间关键点重定向模块(SKR)处理体型差异;4)底层全身控制器执行运动。实验在Unitree G1机器人上验证了取放和垃圾处理任务的有效性。相比现有方法,Bifr
skrl是一款新兴的开源强化学习库,专注于可读性、模块化和透明性。它解决了现有RL库在模块化、可读性、新仿真平台支持等方面的不足,采用七大独立组件设计,支持OpenAI Gym、Isaac Gym等环境。其独特优势包括原生支持Isaac Gym全版本、创新的范围并行训练机制(允许多智能体同步对比和共享经验池),以及不预设策略类的高度灵活性。性能测试显示其训练效率与主流库相当,在机器人仿真领域尤其突
本文提出了一种创新方法,通过将推理延迟的模拟过程前置到训练阶段,解决了大型视觉-语言-动作模型(VLA)在机器人实时控制中的延迟问题。该方法通过修改训练数据的构造方式(差异化时间步嵌入、真值注入和掩码损失函数),使模型在训练时就能学会处理延迟,从而在推理阶段无需额外计算开销。实验表明,该方法不仅显著降低了端到端延迟(从135ms降至108ms),还提高了高延迟场景下的鲁棒性。尽管存在灵活性受限等局
本文提出了一种创新方法,通过将推理延迟的模拟过程前置到训练阶段,解决了大型视觉-语言-动作模型(VLA)在机器人实时控制中的延迟问题。该方法通过修改训练数据的构造方式(差异化时间步嵌入、真值注入和掩码损失函数),使模型在训练时就能学会处理延迟,从而在推理阶段无需额外计算开销。实验表明,该方法不仅显著降低了端到端延迟(从135ms降至108ms),还提高了高延迟场景下的鲁棒性。尽管存在灵活性受限等局
本文提出了一种创新方法,通过将推理延迟的模拟过程前置到训练阶段,解决了大型视觉-语言-动作模型(VLA)在机器人实时控制中的延迟问题。该方法通过修改训练数据的构造方式(差异化时间步嵌入、真值注入和掩码损失函数),使模型在训练时就能学会处理延迟,从而在推理阶段无需额外计算开销。实验表明,该方法不仅显著降低了端到端延迟(从135ms降至108ms),还提高了高延迟场景下的鲁棒性。尽管存在灵活性受限等局
对于任何致力于把人形机器人从仿真推向现实的研究者或工程师,AGILE不仅提供了代码,更提供了一套成熟的、经过实战检验的工程范式。
Motion Planning Diffusion (MPD)是一个创新且强大的机器人运动规划框架。它巧妙地将扩散模型的强大生成能力与基于梯度的优化相结合,通过 B-样条实现了高效、平滑的轨迹表示。实验证明,MPD 不仅能从先验数据中学习多模态的轨迹分布,还能在规划时通过成本引导,灵活、高效地适应新障碍物等任务变化,生成高质量的无碰撞轨迹。该方法在模拟和真实世界的多项任务中均表现出优越性,为“学习
摘要: 本文综述了深度学习在机器人操作臂运动规划中的应用,探讨构建通用神经运动规划器的挑战与路径。论文系统分析了MLP、CNN、Transformer等架构如何优化经典规划算法的采样、导向和碰撞检测模块,指出当前神经规划器面临泛化性差、数据稀缺、安全无保证等核心问题。通过案例(如MPNet、扩散模型)展示了神经网络在提升规划效率(10倍加速)和端到端学习方面的潜力,并提出建立大规模数据集、结合基础
摘要: 研究团队提出 MOSAIC 系统,解决人形机器人仿真与真实场景的运动跟踪差异问题。传统强化学习策略在仿真中表现优异,但部署到真实机器人时因接口延迟、噪声等问题频繁失败。MOSAIC 的核心创新是通用运动策略+轻量残差适配器:先在大规模多源运动数据(64小时)训练通用策略,再用少量真实遥操作数据(30分钟)训练残差模块,实现快速接口适配。实验表明,该系统在Unitree G1机器人上支持离线
Pink是一个基于二次规划(QP)的Python逆运动学(IK)求解库,专为解决机器人多任务运动规划问题而设计。该库由法国学者Stéphane Caron开发,基于Pinocchio动力学库构建,通过加权任务方法处理多个冲突目标(如末端定位与平衡保持)。Pink将复杂IK问题转化为QP形式,支持多种求解器,并正确实现了李群上的位姿误差计算。主要功能包括FrameTask(末端位姿跟踪)和Postu







