logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

生成对抗网络(GAN)

对抗”的含义就是生成器通过不断的训练尽可能的生成以假乱真的图像,判别器通过不断的识别尽可能的区分图像的真假。第一张图是训练集选取的部分图片,第二张图片是由生成器产生的图片,可以看出,通过多次训练,生成可以生成比较接近训练集图片的图片。生成器的训练过程,简单来说就是,给定网络,给定标签,然后更新输入(这里是随机数据,可以符合一定的分布),使输出图像对应的标签逐渐靠近给定的标签;也是生成对抗网络中的一

#python
Django使用多个数据库

一、定义数据库使用Django的多个数据库的第一步是告诉Django将使用的数据库服务器。 这是使用DATABASES设置完成的。 此设置将数据库别名映射到该特定连接的设置字典,该数据库别名是一种在整个Django中引用特定数据库的方法。 内部词典中的设置在DATABASES文档中有完整描述。数据库可以包含您选择的任何别名。 当没有选择其他数据库时,Django使用具有默认别名default的数据

强化学习算法

强化学习问题的目标是依据策略执行一系列合适的动作以最大化累计回报。强化学习的算法主要分成三类:基于值函数的方法、基于策略的方法和演员-评论家方法。也就是说,可以通过逼近值函数再利用ϵ−greedy\epsilon-greedyϵ−greedy策略间接的确定策略,也可以建立策略函数,将策略参数化,还可以结合这两类方法既学习值函数,又学习策略。...

#python
Sarsa

基本概念SarsaSarsa算法与Q-Learning算法极为相似,‘sarsa’五个字母的含义即s(当前状态),a(当前行为),r(奖励),s(下一步状态),a(下一步行为),也就是说我们在进行这一步操作时已经想到当前s对应的a,并且想好了下一个s’和a’。Sarsa的使用的数学模型如下:Sarsa算法的伪代码如下:Q-learning和Sarsa的不同:Q-learning算法和Sarsa算法

#python
python glob模块

glob模块时python标准库中一个重要的模块,主要用来查找符合特定规则的目录和文件,并将搜索的到的结果返回到一个列表中。该模块包含三个特殊的通配符∗、?、[]*、?、[]∗、?、[]以及三个函数glob()、iglob()、escape()。其中,∗*∗表示匹配一个或多个字符,???表示匹配一个字符,[][][]表示匹配指定范围内的一个字符。比如,[0-9]表示匹配一个数字,[a-z]表示匹配

#python
Django 模型层(models) 复杂查询详解

Django 模型层(models) 复杂查询详解一般Django orm 和原生sql混合使用1.测试文件只单独测试django中的某一个py文件 不一定是tests.py1.配置在任意一个py文件中书写以下代码 应用下的tests或者自己新建一个import osif __name__ == "__main__":os.environ.setdefault("DJANGO_SETTINGS_M

Django使用多个数据库

一、定义数据库使用Django的多个数据库的第一步是告诉Django将使用的数据库服务器。 这是使用DATABASES设置完成的。 此设置将数据库别名映射到该特定连接的设置字典,该数据库别名是一种在整个Django中引用特定数据库的方法。 内部词典中的设置在DATABASES文档中有完整描述。数据库可以包含您选择的任何别名。 当没有选择其他数据库时,Django使用具有默认别名default的数据

循环神经网络(RNN)

久风山思市诏屐,雪矣不丘见中干。在上图中,输入门用来决定什么值应该更新,遗忘门用来决定需要丢弃的信息,输出门输出我们确定输出的那部分,这个输出会基于当前的细胞状态,是一个过滤后的版本。复位门决定了如何将新的输入信息与前面的记忆相结合,更新门用于控制前一时刻的状态信息被带入到当前状态中的程度,也就是更新门帮助模型决定到底要将多少过去的信息传递到未来,简单来说就是用于更新记忆。门控循环网络可以说是简化

#python
tf.linalg.band_part函数

函数原型tf.linalg.band_part(input, num_lower, num_upper, name=None)函数说明band_part函数主要用于处理方形矩阵的副对角线上的元素。以对角线为中心,对副对角线上的元素进行取舍(是否用0填充)。参数num_lower表示下三角矩阵保留的副对角线的数量,比如num_lower=2表示下三角矩阵从第二条副对角线开始,之后的所有的副对角线的元

#矩阵#线性代数
AC & A2C & A3C

基本概念Actor-Critic(AC)AC算法是一种既基于值函数、又基于策略函数的算法。这里所说的基于值函数的算法,主要指的是算法本身输出的所有动作的价值,根据最高价值来选择动作,这类算法不能选取连续的动作。而基于值函数的算法指算法本身输出下一步要采取各种动作的概率,然后根据概率来选取动作。一个简单的AC算法(QAC)的策略梯度学习分成两部分:1、Critic:使用状态动作价值函数qω(s,a)

#python
    共 19 条
  • 1
  • 2
  • 请选择