
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Git 提供了多个命令来查询某个文件的更新历史。--follow-p--patch--statgit log -pgitk通过这些命令,你可以方便地查询和分析 Git 仓库中某个文件的更新历史。

简单介绍在linux系统中创建一个多人协同作业用的git repository的步骤及一些相关设置。这里仅考虑在同一linux服务器内的用户要访问该git-repo,暂不涉及从外部网络访问该git-repo的设置。首先,假定你有管理员权限,并且假定先创建了一个组grp_git,允许该组中的成员访问该共享git repository。

本节我们继续基于多臂老虎机问题学习一种基于梯度下降的行动选择方法:Gradient Bandit AlgorithmRef: Sutton-RLBook2020-2.8: Gradient Bandit Algotihm
强化学习中多臂老虎机问题系列第4篇。讨论非平稳环境下的跟踪问题。给出python实现以及仿真结果
Sutton-RL-Book第2版第3章习题详解第二部分:Ex3.17~Ex3.29
本文概要介绍强化学习的最经典和最重要的形式化描述工具的马尔可夫决策过程的基本概念、基本要素以及基本的动力学(dynamics)机制。

通过多臂老虎机的例子来研究强化学习的基于评价性反馈的特性,介绍强化学习的一些基本学习方法。本文为Sutton-RL-book的2.1~2.3节的学习笔记。这是关于多臂老虎机系列学习笔记的第一篇
本文我们针对多臂老虎机问题做一个基于python的仿真,通过仿真来具体地探索一下epsilon-greedy算法在多臂老虎机问题上的表现。本文中代码在Jupyter Notebook中运行确认过。
对F.chollet《Deep Learning with Python》#5.3.1中所提到的预特征提取不能与数据增强结合使用的原因的辅助解释
上一篇我们用全连接层(Dense layer)实现了一个分类器用于MNIST手写数字识别。但是由于MNIST的数据样本是28x28的图像,所以更适合于用卷积神经网络来实现它的识别任务。本文就来介绍如何构建一个简单的卷积神经网络用于MNIST手写数字识别。







