不负韶华ღ 个人主页

@weixin_49346755

不负韶华ღ

2022-11-25 10:56:49 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

生成对抗网络（GAN）

对抗”的含义就是生成器通过不断的训练尽可能的生成以假乱真的图像，判别器通过不断的识别尽可能的区分图像的真假。第一张图是训练集选取的部分图片，第二张图片是由生成器产生的图片，可以看出，通过多次训练，生成可以生成比较接近训练集图片的图片。生成器的训练过程，简单来说就是，给定网络，给定标签，然后更新输入（这里是随机数据，可以符合一定的分布），使输出图像对应的标签逐渐靠近给定的标签；也是生成对抗网络中的一

#python

Django使用多个数据库

一、定义数据库使用Django的多个数据库的第一步是告诉Django将使用的数据库服务器。这是使用DATABASES设置完成的。此设置将数据库别名映射到该特定连接的设置字典，该数据库别名是一种在整个Django中引用特定数据库的方法。内部词典中的设置在DATABASES文档中有完整描述。数据库可以包含您选择的任何别名。当没有选择其他数据库时，Django使用具有默认别名default的数据

强化学习算法

强化学习问题的目标是依据策略执行一系列合适的动作以最大化累计回报。强化学习的算法主要分成三类：基于值函数的方法、基于策略的方法和演员-评论家方法。也就是说，可以通过逼近值函数再利用ϵ−greedy\epsilon-greedyϵ−greedy策略间接的确定策略，也可以建立策略函数，将策略参数化，还可以结合这两类方法既学习值函数，又学习策略。...

#python

Django使用多个数据库

tf.linalg.band_part函数

函数原型tf.linalg.band_part(input, num_lower, num_upper, name=None)函数说明band_part函数主要用于处理方形矩阵的副对角线上的元素。以对角线为中心，对副对角线上的元素进行取舍（是否用0填充）。参数num_lower表示下三角矩阵保留的副对角线的数量，比如num_lower=2表示下三角矩阵从第二条副对角线开始，之后的所有的副对角线的元

#矩阵 #线性代数

AC & A2C & A3C

基本概念Actor-Critic（AC）AC算法是一种既基于值函数、又基于策略函数的算法。这里所说的基于值函数的算法，主要指的是算法本身输出的所有动作的价值，根据最高价值来选择动作，这类算法不能选取连续的动作。而基于值函数的算法指算法本身输出下一步要采取各种动作的概率，然后根据概率来选取动作。一个简单的AC算法（QAC）的策略梯度学习分成两部分：1、Critic：使用状态动作价值函数qω(s,a)

#python

datasets Dataset类（1）

函数说明根据ArrowTable产生一个Dataset对象。根据字典来创建Dataset数据集对象。2、from_pandas函数根据pandas中的DataFrame对象创建Dataset对象。3、from_csv函数根据csv文件来创建Dataset对象。根据json文件来创建Dataset对象。根据txt文件来创建Dataset对象。根据parquet文件来创建Dataset对象。根据arr

#python #机器学习 #数据挖掘

常用数据集

机器翻译任务1、中英翻译WMT、AI Challenge、UM-crops

#数据仓库

卷积神经网络（CNN）

基本概念卷积卷积的目的是为了从图像中提取特征。可以从输入的一小块数据中学到图像的特征，并且可以保留像素间的空间关系。下面用一张图来表示卷积的具体操作：池化池化可以降低输入表示的空间尺度，是输入特征维度变小，也会使网络中的参数和计算的数量更加可控的变小，因此可以控制过拟合。空间池化有最大化、平均化、加和等方式。卷积神经网络卷积神经网络相当于全连接神经网络的改进，最大的不同是：卷积神经网络相邻层之间的

#python

SAC：柔性动作-评价

基本概念SACSAC全称Soft Actor-Critic，中文名柔性动作-评价。SAC算法解决的问题是离散动作空间和连续动作空间的强化学习问题，是off-policy的强化学习算法。SAC和TD3的网络结构类似，主网络都拥有1个Actor网络和2个Critic网络。但是，对于SAC来说，目标网络只有两个Critic网络，没有Actor网络。也就是说，SAC有1个Actor网络和4个Critic网

#python

共 14 条

请选择