all is okk 个人主页

@congxing9333

all is okk

2023-02-10 17:04:32 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习——从Q-Learning到DQN

1 学习目标复习Q-Learning；理解什么是值函数近似（Function Approximation）；理解什么是DQN，弄清它和Q-Learning的区别是什么。2 用Q-Learning解决经典迷宫问题现有一个5房间的房子，如图1所示，房间与房间之间通过门连接，编号0到4,5号是房子外边，即我们的终点。我们将agent随机放在任一房间内，每打开一个房门返回一个reward。图2为房间之间的

Learning a Decentralized Multi-arm Motion Planner基于强化学习的多机械臂运动规划算法

Abstract我们提出了一种闭环多臂运动规划器，该规划器具有可扩展性和灵活性。传统的多臂机器人系统依赖于集中的运动规划算法，其运行时间往往随机器人数量呈指数级增长，因此，无法用开环控制来处理动态环境。在本文中，我们利用多智能体强化学习来解决这一问题。在多臂系统中，通过观察机器人的工作空间状态和目标末端执行器姿态，训练一种分散策略来控制其达到目标末端执行器姿态。该策略是使用软演员评论家和来自基于采

#人工智能

关于nvidia-smi和nvcc -V显示的cuda版本不一致的问题

问题之前就发现，nvidia-smi 中的CUDA 版本与 nvcc不一致，nvidia-smi的结果显示CUDA版本是11.0，而从nvcc-V命令来看，却是CUDA 10.0。但是跑代码也没啥问题，就没有管了。今天，心血来潮，想探究下原因。分析其实是因为CUDA 有两种API，分别是运行时 API 和驱动API，即所谓的 Runtime API 与 Driver API。nvidia-sm

关于nvidia-smi和nvcc -V显示的cuda版本不一致的问题

转载大佬链接——基于视觉的机器人（机械臂）抓取论文（代码开源的有标注链接）汇总 vision-based-robotic-grasping

抓取论文汇总，作者总结得很全面，也一直在更新。地址：https://github.com/GeorgeDu/vision-based-robotic-grasping以下是目录

#深度学习 #github #计算机视觉

梳理 | 机器人学习（Robot Learning）的发展

机器人学习这个话题上，在这个领域做出最重要贡献的是加州伯克利大学的Pieter Abbeel和Sergey Levine团队，几乎可以说他们以一个团队之力开拓了机器人学习这个领域。梳理一下机器人学习这两年发展过程中出现的一些有影响力的paper。Robot Learning就是面对Robot这种实体机器人本身。Robot Learning想要解决的核心问题是让机器人能够自己学会执行各种决策控制任

#人工智能 #机器学习

到底了