logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【超详细】R语言实现各种数据可视化

color = "cyl", # 设置按照cyl填充颜色size = 8, # 设置点的大小palette = "jco", # 修改颜色画板sorting = "descending", # 设置降序排序add = "segments", # 添加辅助线段add.params = list(color = "lightgray", size = 1.2), # 设置辅助线段的大小和颜色rotat

文章图片
#r语言
【强化学习】深度确定性策略梯度(DDPG)算法求解 Pendulum 问题 + Pytorch代码实战

动作:往左转还是往右转,用力矩来衡量,即力乘以力臂。范围[-2,2]状态:cos(theta), sin(theta) , thetadot(角速度)奖励:总的来说,越直立拿到的奖励越高,越偏离,奖励越低。游戏结束:200步后游戏结束。所以要在200步内拿到的分越高越好。

文章图片
【强化学习】Q-Learning算法求解迷宫寻路问题 + Java代码实现

相信大多数小伙伴应该和我一样,之前在学习强化学习的时候,一直用的是Python,但奈何只会用java写后端,对Python的一些后端框架还不太熟悉,(以后要集成到网站上就惨了),于是就想用Java实现一下强化学习中的Q-Learning算法,来搜索求解人工智能领域较热门的问题—迷宫寻路问题。(避免以后要用的时候来不及写)。下面仅对Q-Learning算法对简单介绍Q学习是一种异策略(off-pol

文章图片
#人工智能#java
【强化学习】Q-Learning算法求解悬崖行走问题 + Python代码实战

下面仅对Q-Learning算法对简单介绍Q学习是一种异策略(off-policy)算法。目标策略(target policy)和行为策略(behavior policy)。目标策略就是我们需要去学习的策略,相当于后方指挥的军师,它不需要直接与环境进行交互行为策略是探索环境的策略,负责与环境交互,然后将采集的轨迹数据送给目标策略进行学习,而且为送给目标策略的数据中不需要at+1a_{t+1}at+

文章图片
#python#贪心算法
【强化学习】Sarsa算法求解悬崖行走问题 + Python代码实战

Sarsa 是一种同策略(on-policy)算法,它优化的是它实际执行的策略,它直接用下一步会执行的动作去优化 Q 表格。同策略在学习的过程中,只存在一种策略,它用一种策略去做动作的选取,也用一种策略去做优化。所以 Sarsa 知道它下一步的动作有可能会跑到悬崖那边去,它就会在优化自己的策略的时候,尽可能离悬崖远一点。Q(S,A)←Q(S,A)+α(R+γQ(S′,A′)−Q(S,A))Q(S,

文章图片
#python#贪心算法
【强化学习】深度Q网络(DQN)求解倒立摆问题 + Pytorch代码实战

Agent 必须在两个动作之间做出决定 - 向左或向右移动推车 - 以使连接到它的杆保持直立。深度 Q\mathrm{Q}Q 网络算法是这样的,我们初始化两个网络 :估计网络 QQQ 和 目标网络 Q^,Q^\hat{Q} , \hat{Q}Q^​,Q^​ 就等于 QQQ ,一开始 目标网络 Q^\hat{Q}Q^​ 与原来的 QQQ 网络是一样的。在每一个回合中,我们用演员与环境交互,在每一次交

文章图片
【强化学习】噪声深度Q网络(Noisy DQN)求解倒立摆问题 + Pytorch代码实战

Agent 必须在两个动作之间做出决定 - 向左或向右移动推车 - 以使连接到它的杆保持直立。噪声网络 (noisy net)是在参数的空间上加噪声。噪声网络是指,每一次在一个回合开始的时候,在智能体要与 环境交互的时候,智能体使用 Q\mathrm{Q}Q 函数来采取动作, Q\mathrm{Q}Q 函数里面就是一个网络,我们在网络的每一个参数上加 上一个高斯噪声 (Gaussian noise

文章图片
【运筹优化】蚁群算法求解二维矩形装箱问题(java代码实现)

文章目录1 前言2 代码迁移3 蚁群算法3.1 蚂蚁类 Ant3.2 蚁群算法类 ACO_Packing4 运行结果1 前言之前我已经写过一篇禁忌搜索算法求解二维矩形装箱问题(java代码实现),如果有对二维矩形装箱问题的背景不是很了解的朋友可以去看看2 代码迁移项目的大体框架(一些实体类,数据读取类等)和禁忌搜索算法求解二维矩形装箱问题(java代码实现)中的差不多,所以本文只提供蚁群算法的核心

文章图片
#java
【系统开发】尚硅谷 - 谷粒商城项目笔记(三):OSS阿里云存储

上传的账号信息存储在应用服务器上传前先找应用服务器要一个policy上传策略,生成防伪签名添加依赖包测试获取需要填写的密钥信息完整测试代码阿里云sdk方式上传添加依赖在配置文件中添加用户id和密钥信息最后在测试类中,自动注入OSS接口,直接使用即可将oss配置加入nacos在pulic命名空间下,创建gulimall-third-party.properties(名字可以自定义),之所以放在pul

文章图片
#阿里云#java
【C++】从0到1入门C++编程学习笔记 - 提高编程篇:STL常用容器(案例 - 员工分组)

【代码】【C++】从0到1入门C++编程学习笔记 - 提高编程篇:STL常用容器(案例 - 员工分组)

文章图片
#c++
    共 76 条
  • 1
  • 2
  • 3
  • 8
  • 请选择