简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
强化学习系列文章(二十六):向量化环境Vectorized EnvironmentsOpenAI Gym最近公布了官方API手册,可以趁机学习一下环境运行的并行化技术。https://www.gymlibrary.ml/pages/vector_api/indexVectorized Environments所谓“矢量化环境”,是运行多个(独立)子环境的环境,可以按顺序运行,也可以使用多处理并行运
查看Ubuntu下的内存CPUGPU使用情况
在新配置的Anaconda的environment中安装tensorflow时,有时虽然安装成功了,import也能成功,但是一些基本的功能是用不了的。经常报错比如:AttributeError: module ‘tensorflow’ has no attribute ‘placeholder’AttributeError: module ‘tensorflow’ has no attr...
NVIDIA CUDA Installation Guide for LinuxLinux系统下的NVIDIA CUDA 安装指南(翻译官方手册)
pip install --no-index -f https://github.com/Kojoley/atari-py/releases atari_py
强化学习系列文章(三十):训练利器Gym Wrapper在训练LunarLander环境的智能体算法时,学习到CleanRL的PPO代码,是我目前测试过训练速度最快的PPO版本。我认为主要贡献之一是采用了成熟的gym.wrapper技术,现总结这项技术的学习笔记。wrapper介绍主要分3类wrapper,分别是action,observation,reward。分别继承ActionWrapper
最近在看MSRA的王井东研究员的《Interleaved Group Convolutions for Deep Neural Networks》。论文中多次提到群卷积这个概念,所以特地学习了一下群卷积。群卷积最早出现于AlexNet中。是为了解决显存不够的问题,将网络部署在两张GTX 580显卡上训练,Alex认为group conv的方式能够增加 filter之间的对角相关性,而且能够减少..