
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
最近自己会把自己个人博客中的文章陆陆续续的复制到CSDN上来,欢迎大家关注我的 个人博客,以及我的github。本文主要讲解有关Double DQN算法、Prioritized Experience Replay DQN 算法和 Dueling DQN 算法的相关内容。对于 DQN 算法的改进主要有三种——Double DQN算法、Prioritized Experience Replay ...
本文主要讲解有关 A3C 算法的相关内容。一、A3C 算法直接引用莫烦老师的话来介绍 A3C 算法:Google DeepMind 提出的一种解决 Actor-Critic 不收敛问题的算法。它会创建多个并行的环境,让多个拥有副结构的 agent 同时在这些并行环境上更新主结构中的参数。并行中的 agent 们互不干扰,而主结构的参数更新受到副结构提交更新的不连续性干扰,所以更新的相关性被降...
本文主要讲解有关 TRPO算法、PPO 算法、PPO2算法以及 DPPO 算法的相关内容。一、PPO 算法PPO(Proximal Policy Optimization) 是一种解决 PG 算法中学习率不好确定的问题的算法,因为如果学习率过大,则学出来的策略不易收敛,反之,如果学习率太小,则会花费较长的时间。PPO 算法利用新策略和旧策略的比例,从而限制了新策略的更新幅度,让 PG 算...
八大基本类型:boolean/short/char/int/long/float/double,Integer是int的包装类,必须实例化后才能使用。注意String类型不是基本类型。instanceof运算符左边是一个对象,右边是一个类,当组左边的对象是右边类或子类创建的对象时返回true,反之为false。一个分号也是一条语句,称作空语句。javac 文件名.java:编译java文件,jav

最近自己会把自己个人博客中的文章陆陆续续的复制到CSDN上来,欢迎大家关注我的 个人博客,以及我的github。前面机器学习的主要部分已经都涉及到了,虽然SVM的部分有些烂尾,并且中间也有好多地方因为自己没弄懂而一带而过……现在也应该开始深度学习的部分了,深度学习的内容没有机器学习那么有条理,可能就是看到哪写到哪,最主要的目的还是理清自己的思路。自己也在纠结一个知识点应该细致到什么程度,是否应该.
最近自己会把自己个人博客中的文章陆陆续续的复制到CSDN上来,欢迎大家关注我的个人博客zuzhiang.cn,以及我的github。本文主要讲解有关聚类的相关算法,包括K均值聚类、层次聚类以及密度聚类等,除此之外,还会讲解聚类算法中的一些基本概念,以及聚类算法效果评判的一个标准——轮廓系数。<!--more-->本文主要是依据李航老师的《统计学习方法》和邹博老师的机器学习...
最近自己会把自己个人博客中的文章陆陆续续的复制到CSDN上来,欢迎大家关注我的 个人博客,以及我的github。本文主要讲解有关 Q-Learning 算法的内容,主要包括 on-policy 和 off-policy 的概念、Q-Learning 算法的基本思想和算法流程,最后还会讲解一个莫烦大神的例子。1. on-policy 和 off-policyon-policy(同策略): 智...
最近自己会把自己个人博客中的文章陆陆续续的复制到CSDN上来,欢迎大家关注我的 个人博客,以及我的github。本文主要讲解有关 Deep Q Network(DQN)算法的相关内容。1. DQN 的基本思想传统的 Q-Learning 算法当 Q 表过大时不仅难以存储而且难以搜索,并且当状态是连续的话,用 Q 表存储是不现实的,这时可以用一个函数来拟合 Q 表,所以提出了神经网络和 Q-...
最近自己会把自己个人博客中的文章陆陆续续的复制到CSDN上来,欢迎大家关注我的 个人博客,以及我的github。本文主要讲解 Sarsa 算法以及 Sarsa(λ\lambdaλ) 算法的相关内容,同时还会分别附上一个莫烦大神写的例子。一、Sarsa 算法Sarsa 算法与 Q-Learning 算法相似,也是利用 Q 表来选择动作,唯一不同的是两者 Q 表的更新策略不同。该算法由于更新一...
本文是论文 End-to-End Unsupervised Deformable Image Registration with a Convolutional Neural Network 的阅读笔记。文章提出了一种端到端的无监督配准模型——变形图像配准网络(Deformable Image Registration Network, DIRNet),并在手写数字数据集 MNIST 和心脏电..







