logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习——怎么查看训练之后的曲线

当训练完一个策略的时候,就会生成一个文件夹,里面存放着很多数据。除了可以演示训练效果,有时候也需要查看训练数据。在logs文件夹下,存放着很多训练结果。找到自己的需要的那一个训练结果的文件夹。注意:这里最好在你的这个文件夹下开终端,输入一部分路径,之后会比较方便。如果打不开这个指令,就需要下载这个包。右键打开链接,就会出现记录的数据。

文章图片
#ubuntu
新手ubuntu+igh主站+零差云控电机调试(3)

在控制电机运动之前,需要调试电机,具体步骤如下~

#linux
新手ubuntu+igh主站+零差云控电机调试(1)

新手超级详细安装ubuntu20.04下的实时内核+补丁

#ubuntu#linux
强化学习——奖励函数公式设计1

本文分析了人形机器人控制中常用的奖励函数类型及其设计原理。主要介绍了五种典型函数形式:指数函数(快速放大/缩小奖励)、线性函数(简单稳定)、范数(量化状态特性)、分段函数(分阶段控制)和示性函数(条件判断)。重点解析了三种组合式奖励函数的设计:1)关节位置奖励采用指数嵌套范数实现快速调整;2)脚部间距奖励通过范数+指数函数处理距离惩罚;3)脚部滑动奖励结合示性函数和速度范数检测滑移。这些复合函数通

#linux#ubuntu
到底了