logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习的连续动作问题

强化学习中对连续动作的定义究竟是怎样?这个问题困扰我很久,我觉得有两层理解:1、动作的选择范围是连续区间,当前的动作与后续的动作之间并无关联,能够直接进行离散跳跃式的选择;2、动作的选择范围是连续区间,前面的动作与后面的动作之间是连续过渡,而不能离散跳跃。到底是哪个咯?...

jetson nano 测试串口

主要参考Jetson nano串口的使用——UART,有改动代码xx.py:import serial as serimport timea = "abcabc\t"b = 0.c = "\tfyo"se = ser.Serial("/dev/ttyTHS1", 9600, timeout=1)while True:b = b + 1se.write(a.encode())se.write(str

python调用地图

【代码】python调用地图。

文章图片
#python#swift#开发语言
批量识别医疗票据【第2版】

对上一版本进行改进

文章图片
#python
基于IMU来做定位,目前看到的最好代码

https://github.com/LibofRelax/IMU-Position-Trackinghttps://github.com/LibofRelax/IMU-Position-Tracking/blob/master/main.pyhttps://github.com/AnshulSood11/Position-Trackerhttps://github.com/betaBison/g

【转载】SoftCon: 用PPO训练一个水下软体仿生机器人

原文链接原创 Cong Wang3月16日微信公众号:robot_learning123传统刚体的机器人研究已经很多年了,最近软体机器人很火,像IJRR、SciRob都在做软体机器人的征稿,包括基础理论建模、驱动器、控制等很多方面。下面这篇论文出自ACM Trans. Graph,主要是搞计算机图形学仿真的,但是作者在给软体仿生生物建模后,还通过PPO去训练控制策略,就很有意思了,可以看作...

Gazebo/ROS中添加力、力矩

文章目录前言一、在gazebo图形界面中进行操作二、MATLABmathworks官网ROS与Matlab语言入门教程-在Gazebo中应用力和力矩三、ROS ANSWERS[优] applying a force to a rigid body[次] Applying a force to a link in gazebo plugin. [closed]前言不一定全面,未来还需要继续梳理...

[停更] 莫烦python强化学习中的【伪代码】和【代码】汇总 [停更]

莫烦python强化学习中的算法【伪代码】汇总前言1、Q_Learning2、Sarsa3、sarsa_lambda4、DQN5、Double DQN6、暂无Dueling DQN7、Prioritized DQN8、Policy Gradients9、暂无Actor_Critic10、DDPG11、A3C12、OpenAI PPO13、DeepMind PPO前言将莫烦python强化学习中..

【转载】Gazebo中为模型添加颜色和纹理

原文文章目录1. 为模型添加颜色和纹理2. 关于Ambient, Diffuse, Specular, and Emissive3. 材料反射的光的成分3.1. Ambient3.2. Diffuse3.3. Specula3.4. Emissive3.5. 成分对比4. 颜色参数在哪里设置4.1. 设置光的颜色成分值4.2. 设置物体的颜色成分值4.2.1. SDF4.2.2. Ogre Ma.

    共 21 条
  • 1
  • 2
  • 3
  • 请选择