logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

论文速读|用于多样化、动态和鲁棒双足机器人行走控制的强化学习

论文详细介绍了一种强化学习(RL)框架,用于开发双足机器人的动态行走控制器。该框架不仅限于单一的行走技能,而是提供了一个统一的解决方案,能够训练出能够适应多种高度动态技能的鲁棒和敏捷的控制策略。这些技能包括周期性的走路和跑步,以及非周期性的跳跃和站立。论文首先阐述了双足机器人行走控制的挑战,包括复杂的未受约束的动态和不同行走技能的多样性。然后,论文介绍了所提出的 RL 框架的详细设计,包括一种新的

文章图片
#机器人
论文速读|通过 SERL 算法优化轻量级双足机器人结构

这篇论文展示了SERL算法在双足机器人结构参数设计中的有效性,提供了推进该领域的重要见解。通过结合强化学习运动控制策略和进化算法,SERL算法成功识别出在指定设计空间内最能满足任务要求的结构参数值。与设计空间内的其他参数相比,验证了SERL算法在实现理论最优值方面的卓越性能。此外,将SERL算法的优化结果应用于实际设计,创造性地开发了Wow Orin双足机器人。未来工作将把SERL算法应用于其他参

文章图片
#机器人#人工智能
论文速读|推进人形运动:通过降噪世界模型学习掌握具有挑战性的地形

本文详细介绍了去噪世界模型学习(DWL)的方法和实验结果。DWL 旨在通过有效的状态表示学习框架来消除模拟与现实之间的差距,从而实现对现实世界挑战性地形的适应。研究团队设计了一个自编码器架构,用于在线适应和状态估计,通过在模拟环境中引入噪声并使用域随机化方法来模拟现实世界中的不确定性。DWL 框架中的策略梯度方法和策略优化算法(PPO)进一步提高了控制策略的鲁棒性和适应性。研究人员还展示了 DWL

文章图片
#学习#机器人#人工智能
论文速读|用于多样化、动态和鲁棒双足机器人行走控制的强化学习

论文详细介绍了一种强化学习(RL)框架,用于开发双足机器人的动态行走控制器。该框架不仅限于单一的行走技能,而是提供了一个统一的解决方案,能够训练出能够适应多种高度动态技能的鲁棒和敏捷的控制策略。这些技能包括周期性的走路和跑步,以及非周期性的跳跃和站立。论文首先阐述了双足机器人行走控制的挑战,包括复杂的未受约束的动态和不同行走技能的多样性。然后,论文介绍了所提出的 RL 框架的详细设计,包括一种新的

文章图片
#机器人
Eureka:通过编写大型语言模型实现人类级别的奖励设计01|论文初读

项目地址:Eureka | Human-Level Reward Design via Coding Large Language Models(腾讯元宝)论文初读:

文章图片
#语言模型#人工智能#自然语言处理
论文速读|用于多样化、动态和鲁棒双足机器人行走控制的强化学习

论文详细介绍了一种强化学习(RL)框架,用于开发双足机器人的动态行走控制器。该框架不仅限于单一的行走技能,而是提供了一个统一的解决方案,能够训练出能够适应多种高度动态技能的鲁棒和敏捷的控制策略。这些技能包括周期性的走路和跑步,以及非周期性的跳跃和站立。论文首先阐述了双足机器人行走控制的挑战,包括复杂的未受约束的动态和不同行走技能的多样性。然后,论文介绍了所提出的 RL 框架的详细设计,包括一种新的

文章图片
#机器人
论文速读|ROS-LLM:具有任务反馈和结构化推理的具身智能ROS 框架

ROS-LLM 框架旨在通过集成大型语言模型(LLM)和机器人操作系统(ROS),实现对机器人的直观编程。该框架支持通过聊天界面接收自然语言提示,并能够根据 ROS 环境中的传感器读数自动提取和执行行为。框架支持三种行为模式:序列、行为树和状态机。此外,通过模仿学习,用户可以向系统添加新的机器人动作。该研究通过实验验证了框架的鲁棒性、可扩展性和适应性,并在多种场景中展示了其性能,包括长时间跨度的任

文章图片
#机器人#人工智能
论文速读|基于手臂约束的轮腿机器人运动操控课程学习

本文提出了一种用于轮腿机器人局部操控的强化学习框架,使它们能够在高度动态的情况下执行一系列复杂的操作任务。通过引入臂约束网络和奖励感知课程学习方法,解决了引入机械臂带来的稳定性、安全性和效率挑战。仿真和真实机器人实验验证了该架构的有效性,展示了其在复杂环境中的适应能力。未来的工作将扩展到多智能体协作任务。

文章图片
#机器人
论文速读|I-CTRL:通过受限强化学习使人型机器人模仿和控制

该框架通过在非物理基础的转换后的运动上施加受限的强化学习算法,提高了运动相似度,并确保了跟随参考人类轨迹的能力。该研究的贡献包括:1) 实现了多种人型机器人的物理相容的人类 ähnliche 运动学习;2) 设计了一种新的样本高效的受限强化学习算法,该算法能够更好地保留目标运动的风格,并且能够泛化到大约 10,000 种运动,使用单一的策略和共享的奖励;3) 对四种不同的人型机器人进行了定量和定性

文章图片
#机器人#人工智能
论文速读|I-CTRL:通过受限强化学习使人型机器人模仿和控制

该框架通过在非物理基础的转换后的运动上施加受限的强化学习算法,提高了运动相似度,并确保了跟随参考人类轨迹的能力。该研究的贡献包括:1) 实现了多种人型机器人的物理相容的人类 ähnliche 运动学习;2) 设计了一种新的样本高效的受限强化学习算法,该算法能够更好地保留目标运动的风格,并且能够泛化到大约 10,000 种运动,使用单一的策略和共享的奖励;3) 对四种不同的人型机器人进行了定量和定性

文章图片
#机器人#人工智能
    共 19 条
  • 1
  • 2
  • 请选择