logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

sheng的学习笔记-AI-强化学习(Reinforcement Learning, RL),模仿学习(imitation learning)

强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。

文章图片
#人工智能#机器学习
sheng的学习笔记-AI-归纳逻辑程序设计(ILP)

归纳逻辑程序设计采用自底向上的规则生成策略,直接将一个或多个正例所对应的具体事实(grounded fact)作为初始规则,再对规则逐步进行泛化以增加其对样例的覆盖率。泛化操作可以是将规则中的常量替换为逻辑变量,也可以是删除规则体中的某个文字。为简便起见,暂且假定“更好(X,Y)”仅决定于(X,Y)取值相同的关系,正例“更好(1,10)”和“更好(1,15)”所对应的初始规则分别为更好(1,10)

文章图片
#人工智能#机器学习
sheng的学习笔记-【中】【吴恩达课后测验】Course 4 -卷积神经网络 - 第四周测验

10.你现在用拥有的是3D的数据,现在构建一个网络层,其输入的卷积是32×32×32×1632×32×32×16(此卷积有16个通道),对其使用3232个3×3×33×3×3的过滤器(无填充,步长为1)进行卷积操作,请问输出的卷积是多少?6.你在一个拥有100种不同的分类的数据集上训练一个卷积神经网络,你想要知道是否能够找到一个对猫的图片很敏感的隐藏节点(即在能够强烈激活该节点的图像大多数都是猫的

文章图片
#神经网络#深度学习
sheng的学习笔记-docker部署Greenplum

创建的默认数据库是gpadmin,密码也是这个。创建的默认数据库是gpadmin,密码也是这个。打开终端,输入代码,查看版本。

文章图片
#docker#数据仓库
sheng的学习笔记-AI-强化学习(Reinforcement Learning, RL),模仿学习(imitation learning)

强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。

文章图片
#人工智能#机器学习
sheng的学习笔记-【中】【吴恩达课后测验】Course 4 -卷积神经网络 - 第三周测验

饮料罐头是圆的,而包装盒是方的,每一罐饮料的大小是一样的,每个图像中最多只有一罐饮料,现在你有下面的方案可供选择,这里有一些训练集图像,你的神经网络最合适的输出单位是什么?5.当你训练一个视频中描述的对象检测系统时,里需要一个包含了检测对象的许多图片的训练集,然而边界框不需要在训练集中提供,因为算法可以自己学习检测对象,这个说法对吗?9.假如你在下图中的预测框中使用非最大值抑制,其参数是放弃概率≤

文章图片
#深度学习#神经网络
sheng的学习笔记-AI-蒙特卡罗强化学习

亦称“无模型学习”​。在现实的强化学习任务中,环境的转移概率、奖赏函数往往很难得知,甚至很难知道环境中一共有多少状态.若学习算法不依赖于环境建模,则称为“免模型学习”(model-free learning)在免模型情形下,策略迭代算法首先遇到的问题是策略无法评估,这是由于模型未知而导致无法做全概率展开.此时,只能通过在环境中执行选择的动作,来观察转移的状态和得到的奖赏。蒙特卡罗是强化学习中的免模

文章图片
#人工智能#机器学习
    共 14 条
  • 1
  • 2
  • 请选择