logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习的数学原理学习笔记 - 策略梯度(Policy Gradient)

强化学习的数学原理学习笔记:基于策略(Policy-based)的策略梯度方法(Policy Gradient),包括对REINFORCE算法的介绍。

文章图片
#机器学习#人工智能#深度学习
强化学习的数学原理学习笔记 - 基于模型(Model-based)

强化学习的数学原理学习笔记:基于模型(Model-based)的强化学习方法,包括对值迭代和策略迭代算法的介绍。

文章图片
#机器学习#人工智能#深度学习
强化学习的数学原理学习笔记 - 蒙特卡洛方法(Monte Carlo)

强化学习的数学原理课程学习笔记:蒙特卡洛方法(Monte Carlo,MC),包括对ε-Greedy的介绍。

文章图片
#机器学习#人工智能#深度学习
强化学习的数学原理学习笔记 - 时序差分学习(Temporal Difference)

强化学习的数学原理学习笔记:时序差分学习(Temporal Difference,TD),包括对基础TD、Sarsa和Q-learning等算法的介绍。

文章图片
#人工智能#机器学习#深度学习
强化学习的数学原理学习笔记 - 蒙特卡洛方法(Monte Carlo)

强化学习的数学原理课程学习笔记:蒙特卡洛方法(Monte Carlo,MC),包括对ε-Greedy的介绍。

文章图片
#机器学习#人工智能#深度学习
强化学习的数学原理学习笔记 - 时序差分学习(Temporal Difference)

强化学习的数学原理学习笔记:时序差分学习(Temporal Difference,TD),包括对基础TD、Sarsa和Q-learning等算法的介绍。

文章图片
#人工智能#机器学习#深度学习
强化学习的数学原理学习笔记 - 基于模型(Model-based)

强化学习的数学原理学习笔记:基于模型(Model-based)的强化学习方法,包括对值迭代和策略迭代算法的介绍。

文章图片
#机器学习#人工智能#深度学习
强化学习的数学原理学习笔记 - Actor-Critic

强化学习的数学原理学习笔记: Actor-Critic,包括对A2C、DPG等算法和重要性采样等概念的介绍。

文章图片
#机器学习#人工智能#深度学习
FFmpeg的GOP(I帧)对齐问题

起因在DSAH视频系统(服务器&播放器)搭建中,当使用mp4dash对多个分辨率的视频进行切片时,遇到了一个错误:Parsing media file 1: f1080p.mp4Parsing media file 2: f720p.mp4Parsing media file 3: f480p.mp4Parsing media file 4: f360p.mp4Parsing ...

Ubuntu下Bento4(mp4info、mp4fragment、mp4dash)的安装及使用

操作系统:Ubuntu 16.04下载:在Downloads | Bento4中下载编译好的zip包,如:Bento4-SDK-1-5-1-629.x86_64-unknown-linux.zip解压:unzip Bento4-SDK-1-5-1-629.x86_64-unknown-linux.zip添加环境变量,便于直接输入命令:编辑/etc/profile,将bento4目...

    共 15 条
  • 1
  • 2
  • 请选择