logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

理解快速离散傅里叶变换算法(FFT)

FFT是一个非常快速的离散傅里叶变换算法,他的算法复杂度是O(nlog⁡n)\displaystyle O( n\log n)O(nlogn)。在讲解FFT之前,我们先介绍普通的离散傅里叶变换的的输入和输出是什么?以及一个离散傅里叶变换的简单应用。离散傅里叶变换的输入是一个数组,比如[5,3,2,1],输出是对应的复数,[11,3-2i,3,3+2i],可以自己试试:这个5,3,2,1可以看做是一

文章图片
#算法#人工智能
强化学习理论入门(Trust Region Policy Optimization介绍)

介绍本文主要介绍Trust Region Policy Optimization这篇文章,这篇文章主要回答了如下2个问题:两个不同策略的value function,他们的差异是多少?有什么办法可以保证,一个策略相比于另外一个策略一定能够提升呢?针对这两个问题,我们先定义一些基本的概念,基本定义下图是一个较为一般的强化学习MDP框架下的概率图模型注意,这个图并不一定通用,特别是reward(比如s

#人工智能
强化学习入门

基本概念Agent : 是程序里面的决策者,他们需要根据环境交互来做出决策.Environment :agent会在里面交互.State : 环境中的状态,比如agent的位置,时间等等。不同的action会有不同的reward.环境有些是可观测的(比如reward),有些是不可观测的。强化学习的任务就是优化累计reward。state value function强化学习最重要的就是

#人工智能
探索性数据分析

探索性数据分析介绍当有人扔给你一份数据时,你对这份数据完全陌生,又没有足够的业务背景,会不会感觉无从下手。如果你什么都不管,直接把数据喂给各种模型,却发现效果不好,因为你没有好的特征,那么你可能需要的是数据探索。首先什么是探索性数据分析(Exploratory Data Analysis,EDA)?实际上,这是一系列的方法,它的目的就是让你最大化对数据的直觉,为了让你对数据有感觉,你不仅需要

#数据分析#数据挖掘
强化学习理论入门(Trust Region Policy Optimization介绍)

介绍本文主要介绍Trust Region Policy Optimization这篇文章,这篇文章主要回答了如下2个问题:两个不同策略的value function,他们的差异是多少?有什么办法可以保证,一个策略相比于另外一个策略一定能够提升呢?针对这两个问题,我们先定义一些基本的概念,基本定义下图是一个较为一般的强化学习MDP框架下的概率图模型注意,这个图并不一定通用,特别是reward(比如s

#人工智能
理解Markov, Chebyshev, Chernoff概率不等式

Markov inequality若Y是非负随机变量,对于所有y>0\displaystyle y >0y>0,都有Pr{Y≥y}≤E⁡[Y]y\mathrm{Pr}\{Y\geq y\} \leq \frac{\operatorname{E}[ Y]}{y}Pr{Y≥y}≤yE[Y]​如上图,yPr{Y≥y}\displaystyle y\mathrm{Pr}\{Y\geq y

#概率论#人工智能#机器学习
置换矩阵也能求导优化

置换矩阵也能优化本文是对论文 Learning Latent Permutations with Gumbel-Sinkhorn Networks的阅读笔记。很多时候我们都希望学习一个置换矩阵(permutation matrix),用来找到一个合适的排序,或者解决一个指派问题,就是找到一个最优的分配策略,他可以用匈牙利算法在多项式时间内解决,然后这个问题是不可微的,也就不能放在神经网络中...

#深度学习
图卷积神经网络(Graph Convolutional Network, GCN)

文章目录从谱聚类说起RatioCut 切图聚类谱分析GCN从傅里叶级数到傅里叶变换傅里叶级数的直观意义傅里叶变换推导Signal Processing on Graph图上的傅里叶变换参考资料从谱聚类说起谱聚类是一种针对图结构的聚类方法,它跟其他聚类算法的区别在于,他将每个点都看作是一个图结构上的点,所以,判断两个点是否属于同一类的依据就是,两个点在图结构上是否属否有边相连,他不一定是直接相连..

Domain Adaptation理论分析

文章目录A theory of learning from different domainsH-divergenceAnalysis of Representations for Domain Adaptation参考资料本文是对两篇文章:A theory of learning from different domainsAnalysis of Representations for ...

用信息论玩猜数字

看到3b1b用信息论玩Wordle,这里写一个玩猜数字的简化版本.用信息论玩猜数字信息论中衡量一个事件的信息是否丰富是从概率出发,在信息论中,1bit的信息量对应着−log⁡212\displaystyle -\log_{2}\frac{1}{2}−log2​21​,意味着,这个事情发生的概率是12\displaystyle \frac{1}{2}21​,且发生之后将能够帮助我们筛选掉一半的搜索空

#游戏#概率论#机器学习
    共 29 条
  • 1
  • 2
  • 3
  • 请选择