logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

什么是强化学习(马尔可夫决策过程)

文章目录什么是强化学习(上)1. 强化学习(概述)2. 马尔可夫决策过程2.1 马尔可夫假设2.2 马尔可夫决策过程2.3 状态值函数(state-value function)2.4 状态-行动价值函数(action-valuefunction)什么是强化学习(上)1. 强化学习(概述)强化学习(Reinforcement learning,简称RL)是机器学习中的一个领域,强调如何基于环境而行

文章图片
#深度学习
matplotlib数据可视化基础(1)

matplotlib基础绘图函数功能函数功能figure.add_subplot创建选中资图,指定行数列数和子图编号plt.figure创建空话不,指定大小和像素plt.xlable(ylabel)添加x(y)轴名称,指定位置,颜色,字体的大小plt.xlim(ylim)指定x(y)轴范围,只能确定一个数值区间,而无法使用字符串标识plt.xt...

#matplotlib
大话深度学习(四)优化神经网络的方法

大话深度学习(五)优化神经网络的方法文章目录大话深度学习(五)优化神经网络的方法前言梯度下降算法随机梯度下降算法自适应学习率算法1.AdaGrad2.RMSProp3.Adam前言一般的神经网络的训练过程大致分为两个阶段:第一阶段:先通过前向传播算法得到预测值,将预测值与真实值做比较,得到二者之间的差别第二阶段:通过反向传播算法计算损失函数对每一个参数的梯度,再根据梯度和学习旅使用梯度下...

什么是强化学习?(贝尔曼方程)

贝尔曼方程表示上述状态价值函数与状态-行为价值函数之间的关系。贝尔曼方程有贝尔曼期望方程和贝尔曼最佳方程。

文章图片
#深度学习#算法#量化投资
大话深度学习(一):初识深度前馈神经网络

大话深度学习与Tensorflow2.0(一):深度前馈神经网络文章目录大话深度学习与Tensorflow2.0(一):深度前馈神经网络初识深度前馈神经网络全连接与稀疏连接初识深度前馈神经网络深度前馈神经网络可简称为前馈神经网络,前馈神经网络最具有代表性的一个样例就是多层感知机(MLP)模型。前馈神经网络的模型是向前的,模型的输入与输出不存在链接,例如一个输入输出满足一个函数y=f(x),...

将强化学习运用到量化投资中实战篇(强化学习架构设计)

通过分析股票投资强化学习中必要的参与因素和作用,RLTrader 的架构主要有数据管理模块(data_manage,py)、主模块(main.py)、学习模块(learners.py)、可视化模块(visualizer.py)组成,其中主模块又分为环境模块(environment.py)、代理模块(agent.py)、神经网络模块组成(networks.py)

文章图片
#深度学习#人工智能#量化投资
大话深度学习(一):初识深度前馈神经网络

大话深度学习与Tensorflow2.0(一):深度前馈神经网络文章目录大话深度学习与Tensorflow2.0(一):深度前馈神经网络初识深度前馈神经网络全连接与稀疏连接初识深度前馈神经网络深度前馈神经网络可简称为前馈神经网络,前馈神经网络最具有代表性的一个样例就是多层感知机(MLP)模型。前馈神经网络的模型是向前的,模型的输入与输出不存在链接,例如一个输入输出满足一个函数y=f(x),...

什么是强化学习?(主要的强化学习概念)

文章目录什么是强化学习?(主要的强化学习概念)4.主要的强化学习概念4.1 基于模型与无模型(Model-based vs. Model-free)4.2 预测(prediction)和控制(control)4.3 On-policy vs. Off-policy4.4主要的强化学习技术4.4.1 蒙特卡洛学习((Monte-Carlo learning, MC)4.4.2 时间差分学习(temp

文章图片
#深度学习#量化投资
将强化学习运用到量化投资中实战篇(执行模块开发)

将强化学习运用到量化投资中实战篇(执行模块开发)文章目录将强化学习运用到量化投资中实战篇(执行模块开发)1.设置程序参数2. 强化学习设置3.运行强化学习强化学习股票投资执行模块(main.py)配置程序参数进行各种条件下的强化学习,根据输入因素使用学习器类进行强化学习,并存储学习到的神经网络。本节内容主要介绍这个模块的程序参数和强化学习执行逻辑。1.设置程序参数通过指定各种选项配置程序参数以执行

文章图片
#深度学习#量化投资
将强化学习运用到量化投资中实战篇(执行模块开发)

将强化学习运用到量化投资中实战篇(执行模块开发)文章目录将强化学习运用到量化投资中实战篇(执行模块开发)1.设置程序参数2. 强化学习设置3.运行强化学习强化学习股票投资执行模块(main.py)配置程序参数进行各种条件下的强化学习,根据输入因素使用学习器类进行强化学习,并存储学习到的神经网络。本节内容主要介绍这个模块的程序参数和强化学习执行逻辑。1.设置程序参数通过指定各种选项配置程序参数以执行

文章图片
#深度学习#量化投资
    共 14 条
  • 1
  • 2
  • 请选择