击上方关注 “终端研发部

 
 
设为“星标”,和你一起掌握更多数据库知识

正好,大家可以跟着我下面总结的一些资源来学习,相信收货一定很大!

1、Ai2Thor仿真环境

AI2-THOR的优势在于可以与环境中的物体进行互动,基于现实中的物理规则,具备高度的逼真性。此外,框架提供了python api供使用者调用。

911dba6605a46b3160d6cc168d3a035c.gif

论文:AI2-THOR: An Interactive 3D Environment for Visual AI

Arxiv:https://arxiv.org/abs/1712.05474

网站:http://ai2thor.allenai.org

Github:https://github.com/allenai/ai2thor

2、Deep-neuroevolution

作者:Uber AI实验室

GitHub地址:https://github.com/uber-common/deep-neuroevolution

b7ab882ab9f560ed4495f64502dfe2b3.gif

1、Deep Neuroevolution: Genetic Algorithms Are a Competitive Alternative for Training Deep Neural Networks for Reinforcement Learning

论文地址:https://arxiv.org/abs/1712.06567

2、Improving Exploration in Evolution Strategies for Deep Reinforcement Learning via a Population of Novelty-Seeking Agents

论文地址:https://arxiv.org/abs/1712.06560

这些代码基于OpenAI此前公布的源代码和论文。

3、DeepMind控制套件

  • 论文:DeepMind Control Suite

  • Arxiv:https://arxiv.org/abs/1801.00690

  • Github:https://github.com/deepmind/dm_control

  • 环境:Python、MuJoCo

4、AI安全网格测试

  • 文章:AI Safety Gridworlds

  • Arxiv:https://arxiv.org/abs/1711.09883

  • Github:https://github.com/deepmind/ai-safety-gridworlds

5、强化学习开源项目--OpenMedBox-DialoDiagnosis

这个项目旨在帮助进行相关研究的同行更容易的对该领域工作进行复现和扩展。

举个例子:开源自动化诊疗工具

OpenMedBox-DialoDiagnosis 是一个 DISC 自主开发的开源自动化诊断系统工具包,包括四个数据集和五种实验方法的复现,架构如图

3a0e7ecf7c81887ce0e901322ab40f9b.png

项目 Github 地址:https://github.com/FudanDISC/DISCOpen-MedBox

5、MAgent强化学习研究平台

MAgent可视化模拟红蓝两军战斗的demo,通过训练一个共享参数DQN模型,最后宏观上智能体学会一些协同策略:合力追击(图2):

341fa62aab4df8628ab995135e195001.gif

添加图片注释,不超过 140 字(可选)

文章:MAgent: A Many-Agent Reinforcement Learning Platform for Artificial Collective Intelligence

Arxiv:https://arxiv.org/abs/1712.00600

Github:https://github.com/geek-ai/MAgent

环境:Linux、OS X、Python 2.7 or python 3

7、项目名称:coreylynch/async-rl

实现算法:A3C

相关论文:Asynchronous Methods for Deep Reinforcement Learning".

推荐理由:结合使用Tensorflow + Keras + OpenAI Gym

Pdf地址:http://arxiv.org/pdf/1602.01783v1.pdf

需要学习的框架:

baselines - openai

github:https://github.com/openai/basel

stable-baselines3

github:https://github.com/hill-a/stabl

FinRL

github: https://github.com/AI4Finance-F

spinningup - openai

github:https://github.com/openai/spinn

需要学习的课程:

基于强化学习是一种机器学习技术,这门功夫是从机器学习功中的神经网络中发扬光大起来的,其又可再细分多种网络: 线性神经网络、卷积神经网络、循环神经网络等。主要用于两大任务: 计算机视觉(Computer Vision,CV)、自然语言处理(NormalLanguage Process,NLP),ChatGPT就是NLP领域中的一个大模型(LLM)。入机器学习门派还得有与时俱进的精神,按照目前的趋势,大模型成为每个赛博炼丹师必须了解的功夫之一

推荐书籍:

《动手学深度学习》

《深度学习轻松学:核心算法与视觉实践》

《强化学习精要:核心算法与TensorFlow实现》

《强化学习》《深入浅出强化学习》

《Deep Learning》

《Neural Networks and Deep Learning》

《Deep Learning with Python》

《TensorFlow:实战Google深度学习框架》

《TensorFlow进阶指南:基础、算法与应用》

《深度学习框架PyTorch:入门与实践》

《21个项目玩转深度学习》

《基于TensorFlow的实践详解 》

最后

学习不在于多,而在于精,我们一天不要学太多,不要学习一些一知半解的知识。第四,形成学习的闭环,学习,复述,关联知识,运用。才能领悟DL学习的精髓!

22f5c80ba83798e8c0cb8e2bbb01ab32.jpeg

回复 【idea激活】即可获得idea的激活方式

回复 【Java】获取java相关的视频教程和资料

回复 【SpringCloud】获取SpringCloud相关多的学习资料

回复 【python】获取全套0基础Python知识手册

回复 【2020】获取2020java相关面试题教程

回复 【加群】即可加入终端研发部相关的技术交流群

阅读更多

用 Spring 的 BeanUtils 前,建议你先了解这几个坑!

lazy-mock ,一个生成后端模拟数据的懒人工具

在华为鸿蒙 OS 上尝鲜,我的第一个“hello world”,起飞!

字节跳动一面:i++ 是线程安全的吗?

一条 SQL 引发的事故,同事直接被开除!!

太扎心!排查阿里云 ECS 的 CPU 居然达100%

一款vue编写的功能强大的swagger-ui,有点秀(附开源地址)

相信自己,没有做不到的,只有想不到的

在这里获得的不仅仅是技术!

a5d2557c5e8ea0b1917464b9b075ea26.png

2d6e77df5bfc881bf8bb32accc8d829c.gif

喜欢就给个“在看957c85eb0fdbef0491a248783a8cc08c.gif 

Logo

瓜分20万奖金 获得内推名额 丰厚实物奖励 易参与易上手

更多推荐