qq_42770218 个人主页

@qq_42770218

qq_42770218

2023-03-12 11:20:47 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

机器人强化学习入门笔记（一）

因为python train.py --task=go2 --num_envs==64 --headless --max_iterations=50中"=="多一个等号；这是因为numpy版本问题，如果遇到这个只需要搜索所有用到np.float的地方将其改为float。表示当前目录（把当前目录当作一个 Python 包/项目来安装）

DeepMimic: Example‑Guided Deep Reinforcement Learning of Physics‑Based Character Skills

输入包括一个角色模型（人形、Atlas机器人、恐龙或龙）、一组参考运动片段和一个任务奖励函数。策略πat∣stgtπat∣stgt接收状态sts_tst和任务目标gtg_tgt，输出用于各关节PD控制器的目标角度。训练使用近端策略优化（PPO）。模仿奖励与任务奖励结合：总奖励rtωIrtIωGrtGrtωIrtIωGrtG。

#人工智能

机器人强化学习入门笔记（一）

DreamWaQ - 基于隐式地形想象的鲁棒四足机器人运动学习

四足机器人需要在现实世界中穿越复杂地形。依赖外部感知 (Exteroception-based)使用相机或 LiDAR 构建地形图。缺陷：对环境条件极其敏感（光照变化、雾、灰尘、黑暗环境）；计算成本高；存在感知延迟；在出现感知失效时系统脆弱。仅依赖本体感知 (Proprioception-based)仅使用关节编码器和 IMU 数据。缺陷：传统的“盲视”行走方法通常难以应对高难度的不规则地形（如高

#机器人 #学习

DeepMimic: Example‑Guided Deep Reinforcement Learning of Physics‑Based Character Skills

#人工智能

到底了