
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文提出了一种名为LingBot-VA的机器人控制模型,通过“看视频想象未来”和“推算动作”同步进行的方式,让机器人能像人类一样根据想象的后果来实时调整动作,从而解决复杂长流程的任务。
本文提出了一种名为MemoryVLA的机器人控制模型,通过模仿人类的记忆机制(工作记忆+长时记忆),让机器人能利用过去的经验来解决需要长时间记忆和复杂步骤的操纵任务。
本文提出了一种名为MemoryVLA的机器人控制模型,通过模仿人类的记忆机制(工作记忆+长时记忆),让机器人能利用过去的经验来解决需要长时间记忆和复杂步骤的操纵任务。
解决pycharm远程debug总跳转remote sources里的办法

本文提出了一种名为TIDAL的分层框架,通过将“语义思考”和“高频动作”解耦,让笨重的AI大脑也能指挥机器人做出敏捷的反应,从而在不降低智能水平的前提下实现高频控制。
本文提出了一种名为TIDAL的分层框架,通过将“语义思考”和“高频动作”解耦,让笨重的AI大脑也能指挥机器人做出敏捷的反应,从而在不降低智能水平的前提下实现高频控制。
本文提出了一种名为SILENTDRIFT的隐蔽后门攻击方法,利用视觉-语言-动作(VLA)模型在动作分块和相对位姿表示上的设计缺陷,通过平滑的微小扰动积累导致机器人执行失败,且难以被检测。
本文提出了一种名为 Being-H0.5 的机器人模型,通过将人类动作作为通用模板,让不同形态的机器人(如机械臂、人形机器人)能共享学习成果,从而实现跨形态的技能泛化和实际部署。
本文提出了一种名为FOFPred的模型,通过语言指令预测未来的光流(像素运动),从而帮助机器人更好地控制动作和生成视频。
本文提出了一种名为ReWorld的框架,利用分层奖励模型和强化学习,解决了视频生成模型在物理真实性、动作合理性和任务逻辑上与视觉效果脱节的问题。







