logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

C++ 多线程学习笔记(4):多个线程数据共享问题分析

1. 创建和等待多个线程示例代码#include <iostream>#include <thread>#include <vector>using namespace std;//子线程起始函数void myprint(int inum){cout << inum << "号线程开始执行" << endl;cout <

论文理解【IL - IRL】 —— Deep Reinforcement Learning from Human Preferences

Deep Reinforcement Learning from Human Preferences模仿学习 —— 逆向强化学习

Pytorch入门(4)—— Tensor和Module的保存与加载

结合代码介绍 pytorch 中 tensor 和 Module 示例的本地存储和加载方法

#pytorch
论文理解【Offline RL】——【One-step】Offline RL Without Off-Policy Evaluation

标题:Offline RL Without Off-Policy Evaluation;发表:NIPS 2021;领域:离线强化学习(offline/batch RL)—— RL-Based / One-step

论文理解【Offline RL】——【BooT】Bootstrapped Transformer for Offline Reinforcement Learning

标题:Bootstrapped Transformer for Offline Reinforcement Learning;发表:NIPS 2022;领域:离线强化学习(offline/batch RL)—— Transformer-Based / 数据增强

专家系统简介

本文对专家系统进行简单介绍,专家系统是机器学习流行之前曾经一度流行的一种智能方法,属于符号主义流派

文章图片
论文翻译 —— Episodic reinforcement learning with associative memory

标题:Episodic reinforcement learning with associative memory文章链接:Episodic reinforcement learning with associative memory领域:强化学习 - 情节控制(episodic control)文章目录EPISODIC REINFORCEMENT LEARNING WITH ASSOCIATI

    共 75 条
  • 1
  • 2
  • 3
  • 8
  • 请选择