
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
强化学习:值迭代和策略迭代
强化学习:值迭代和策略迭代
强化学习:Q-Learning
Q-learning 是强化学习中一个很有名的算法。
强化学习:Sarsa 算法
在强化学习中 Sarsa 和 Q learning 类似 。
强化学习:值函数近似
Sarsa + 值函数近似、Q-learning+ 值函数近似、Deep Q-learning
强化学习:贝尔曼最优公式
强化学习:贝尔曼最优公式
强化学习:Sarsa(λ)
Sarsa (λ ) 是强化学习中基于 Sarsa 的一种提速方法。
强化学习:基于 Q-Learning 的二维迷宫游戏案例(二)
Q-Learning 算法。
强化学习:随机近似与随机梯度下降
强化学习:随机近似与随机梯度下降
自监督学习:自编码器
自监督学习:把 𝒙 作为监督信号来学习,这类算法称为自监督学习(Self-supervised Learning),自编码器算法就是属于自监督学习范畴。
神经网络:传统神经网络基础学习
传统神经网络基础学习