logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习:值迭代和策略迭代

强化学习:值迭代和策略迭代

#算法#动态规划
强化学习:Q-Learning

Q-learning 是强化学习中一个很有名的算法。

#算法
强化学习:Sarsa 算法

在强化学习中 Sarsa 和 Q learning 类似 。

#算法#人工智能
强化学习:值函数近似

Sarsa + 值函数近似、Q-learning+ 值函数近似、Deep Q-learning

#算法#python#人工智能
强化学习:Sarsa(λ)

Sarsa (λ ) 是强化学习中基于 Sarsa 的一种提速方法。

#python#人工智能#算法
强化学习:随机近似与随机梯度下降

强化学习:随机近似与随机梯度下降

#python#算法#机器学习
自监督学习:自编码器

自监督学习:把 𝒙 作为监督信号来学习,这类算法称为自监督学习(Self-supervised Learning),自编码器算法就是属于自监督学习范畴。

#学习#人工智能#深度学习
    共 34 条
  • 1
  • 2
  • 3
  • 4
  • 请选择