logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习中的REINFORCE策略函数

转自:https://blog.csdn.net/Pony017/article/details/81146374从REINFORCE到PPO,看Policy Gradient的前世今生Policy Gradient和Q-learning可以说是model-free RL的两大阵营。前者是off-line、on-policy的方法,后者是on-line、off-policy的方法。前者是策...

Deconvolutional Networks理解

转自:www.cnblogs.com/tornadomeet/p/3444128.html深度网络结构是由多个单层网络叠加而成的,而常见的单层网络按照编码解码情况可以分为下面3类:既有encoder部分也有decoder部分:比如常见的RBM系列(由RBM可构成的DBM, DBN等),autoencoder系列(以及由其扩展的sparse autoencoder, denoise auto...

干货 | 你的 KL 散度 vanish 了吗?

转自:https://www.sohu.com/a/216987798_297288最近(其实是去年)和大家分享过 Variational Autoencoder (VAE) 在对话生成(文本生成)上的一些应用(点击查看)。由于生成模型的新颖性和效果都能让人眼前一亮,所以越来越多的学者都对其进行了探索与尝试。然而当 VAE 和强如RNN/PixelCNN 这样的autoregressive m..

条件变分自编码器CVAE

转自:https://zhuanlan.zhihu.com/p/25518643上一期探讨了变分自编码器模型(VAEs),本期继续生成模型的专题,我们来看一下条件概率版本的变分自编码器(CVAEs)。(对应的,另一类生成模型GANs也有条件概率版本,称为CGANs。)VAE回顾VAE的目标是最大化对数似然函数其中,由于KL散度非负,对数似然函数的变分下界即为...

国际会议级别

附件是计算机领域的学术会议等级排名情况,分为A+, A, B, C, L 共5个档次。其中A+属于顶级会议,基本是这个领域全世界大牛们参与和关注最多的会议。国内的研究者能在其中发表论文的话,是很值得骄傲的成就。A类也是非常好的会议了,尤其是一些热门的研究方向,A类的会议投稿多录用率低,部分A类会议影响力逐步逼近A+类会议。B类的会议分两种,一种称为盛会级,参与的人多,发表的论文也多,论文录...

SeqGAN模型原理和代码解析

1、背景GAN作为生成模型的一种新型训练方法,通过discriminative model来指导generative model的训练,并在真实数据中取得了很好的效果。尽管如此,当目标是一个待生成的非连续性序列时,该方法就会表现出其局限性。非连续性序列生成,比如说文本生成,为什么单纯的使用GAN没有取得很好的效果呢?主要的屏障有两点:1)在GAN中,Generator是通过随机抽样作为开始,...

主成分分析(PCA)原理详解

个人分类: 机器学习与Python版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhongkelee/article/details/44064401转载请声明出处:http://blog.csdn.net/zhongkelee/article/details/44064401一、PCA简介1. 相关背景      上完陈恩...

主成分分析(PCA)原理详解

个人分类: 机器学习与Python版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhongkelee/article/details/44064401转载请声明出处:http://blog.csdn.net/zhongkelee/article/details/44064401一、PCA简介1. 相关背景      上完陈恩...

NLTK模块学习介绍

nltk的全称是natural language toolkit,是一套基于python的自然语言处理工具集。1 NLTK的安装nltk的安装十分便捷,只需要pip就可以。pip install nltk1在nltk中集成了语料与模型等的包管理器,通过在python解释器中执行>>> import nltk>>>

    共 16 条
  • 1
  • 2
  • 请选择