logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

linux ls -la文件信息含义

chmod 【数字】【文件名】:修改权限位

DDPG算法与输出边界值问题

【强化学习】DDPG 算法实现案例DDPG或TD3算法训练时总是输出边界值问题记录强化学习调参技巧一: DDPG算法训练动作选择边界值_分析解决sigmoid函数原理及饱和后梯度消失的问题输出边界值最基本的解决办法有批标准化(model里面加入BN层),输入归一化。实在不行换算法。如何选择深度强化学习算法?MuZero/SAC/PPO/TD3/DDPG/DQN/等(2021-04)...

#机器学习
贪心算法——小船过河

题意:N个人过河,船每次只能坐两个人,船载每个人过河的所需时间不同t[i],每次过河的时间为船上的人的较慢的那个,问最快的过河时间。(船划过去要有一个人划回来)#include<iostream>#include<algorithm>using namespace std;int mintime(int t[], int n) {sort(t, t + n);int sum

模仿学习对比强化学习

模仿学习介绍模仿学习是将专家经验作为样本进行强监督学习的一种方法。模仿学习对比强化学系模仿学习优点:1.简单、稳定的监督学习过程缺点:1.需要提供榜样行为数据2.需要处理多解型行为(例如 绕过障碍物,可以从左边或者右边,但是专家数据不一定覆盖所有行为,可以用多元高斯分布去等方法去处理)3.不能超越人类水平强化学习优点:1.可以超越人类水平缺点:1.需要设置奖励函数2.必须解决策略探索性问题3.训练

#学习#机器学习#深度学习
Pytorch 的 torch.utils.data.DataLoader 参数详解

DataLoader是PyTorch中的一种数据类型,它定义了如何读取数据方式。1、dataset:(数据类型 dataset)输入的数据类型。看名字感觉就像是数据库,C#里面也有dataset类,理论上应该还有下一级的datatable。这应当是原始数据的输入。PyTorch内也有这种数据结构。这里先不管,估计和C#的类似,这里只需要知道是输入数据类型是dataset就可以了。2、batch_s

#pytorch#深度学习#神经网络
Linux修改下载源

Linux上下载大的点的软件都把人等的崩溃。都是从国外的网站下载,在我大天朝你们懂的,所以就把他的源给换一下,我觉得还是阿里牛逼!!!!多谢马粑粑了!首先我需要搞清楚是哪个发行版的Linux的第几个版本,对应版本去找源我本次在虚拟机上装的是ubuntu20.04TLS阿里云ubuntu源路径,根据版本去查找对应的https://developer.aliyun.com/mirror/ubuntu备

unordered_map介绍

unordered_map是C++11提供的新容器。unordered_map和map的区别有:1.map不允许重复元素。unordered_map允许重复元素。2.map内部实现了红黑树,会对键名排序,查找的时间复杂度可达到O(logn)。 unordered_map内部实现了一个哈希表,查找的时间复杂度可达到O(1)。map优点:有序性,这是map结构最大的优点,其元素的有序性在很多应用中都会

linux中断命令

Ctrl+c和ctrl+z都是中断命令,但是他们的作用却不一样.Ctrl+c是强制中断程序的执行。Ctrl+z的是将任务中断,但是此任务并没有结束,他仍然在进程中他只是维持挂起的状态。

1081. Rational Sum (20)

算法思想:①numerator接收分子,denominator接收分母;每次根据分母求最小公倍数l,然后分母通分累加到sum上。遍历结束后sum是分母,l是分子。②碾转相处法求最大公约数,分子分母一起除公约数(绝对值),然后分子分母约分输出。#include<iostream>#include<vector>using namespace std;long long gcd

Acwing 896. 最长上升子序列 II

不用DP,有点巧妙。算法思想:维护一个单调递增的数组。数组a[i]表示长度为i的子序列的最后一个元素是a[i].当我们求最长子序列的时候,比方说,{1,3,5}和{1,3,4}这两个子序列长度都是3,但是4比5小所以4的适用范围比5要大,比方说{1,3,4,5}可以构成长度为4的子序列,而{1,3,5,5}却不行。所以我们要尽可能的使最后一个元素小。#include<iostream>

到底了