
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
文章目录Causal RL的基本settingCRL-TASK 1 GENERALIZED POLICY LEARNING (GPL)CRL-TASK 2. WHEN AND WHERE TO INTERVENE?CRL-TASK 3. COUNTERFACTUAL DECISION-MAKING参考资料本文内容是ICML 2020Causal Reinforcement Learning tut
Markov inequality若Y是非负随机变量,对于所有y>0\displaystyle y >0y>0,都有Pr{Y≥y}≤E[Y]y\mathrm{Pr}\{Y\geq y\} \leq \frac{\operatorname{E}[ Y]}{y}Pr{Y≥y}≤yE[Y]如上图,yPr{Y≥y}\displaystyle y\mathrm{Pr}\{Y\geq y
卷积核参数计算公式笔记notation:设输入为2维图像,输入大小为i∗ii * ii∗i,并且kernel size=kstride = spadding=p公式1:对于任意的i和k,如果s=1,p=0s=1,p=0s=1,p=0,则o=(i−k)+1o=(i-k)+1o=(i−k)+1公式2:对于任意的i和k,p,如果s=1s=1s=1,则o=(i−k)+2p+1o=(...
置换矩阵也能优化本文是对论文 Learning Latent Permutations with Gumbel-Sinkhorn Networks的阅读笔记。很多时候我们都希望学习一个置换矩阵(permutation matrix),用来找到一个合适的排序,或者解决一个指派问题,就是找到一个最优的分配策略,他可以用匈牙利算法在多项式时间内解决,然后这个问题是不可微的,也就不能放在神经网络中...
文章目录从谱聚类说起RatioCut 切图聚类谱分析GCN从傅里叶级数到傅里叶变换傅里叶级数的直观意义傅里叶变换推导Signal Processing on Graph图上的傅里叶变换参考资料从谱聚类说起谱聚类是一种针对图结构的聚类方法,它跟其他聚类算法的区别在于,他将每个点都看作是一个图结构上的点,所以,判断两个点是否属于同一类的依据就是,两个点在图结构上是否属否有边相连,他不一定是直接相连..
文本是教程"The Universal Approximation Theorem for neural networks" by Michael Nielsen的笔记。Universal approximation theorem为什么MLP可以拟合任意的函数?我们考虑一个最简单的神经网络,最后一层是sigmoid函数:事实上这就是一个线性函数,然后经过sigmoid扭曲为一条曲线,显然,b决定
文章目录A theory of learning from different domainsH-divergenceAnalysis of Representations for Domain Adaptation参考资料本文是对两篇文章:A theory of learning from different domainsAnalysis of Representations for ...
看到3b1b用信息论玩Wordle,这里写一个玩猜数字的简化版本.用信息论玩猜数字信息论中衡量一个事件的信息是否丰富是从概率出发,在信息论中,1bit的信息量对应着−log212\displaystyle -\log_{2}\frac{1}{2}−log221,意味着,这个事情发生的概率是12\displaystyle \frac{1}{2}21,且发生之后将能够帮助我们筛选掉一半的搜索空
Normalizing Flowflow的核心思想就是这个分布变换的公式,如果y=f(x)\displaystyle y=f( x)y=f(x),且f\displaystyle ff是可逆的,则px(x)=py(f(x))∗∣detJf(x)∣py(y)=px(f−1(y))∗∣detJf−1(y)∣p_{x} (x)=p_{y} (f(x))*|\det Jf(x)|\\p_{y} ...
直观理解Neural Tangent Kernel本文是文章Some Intuition on the Neural Tangent Kernel的翻译整理.一句话总结:NTK衡量的是,在使用SGD优化参数下,其对应的随机到样本x′\displaystyle x'x′,在参数更新非常一小步η\displaystyle \etaη后,f(x)\displaystyle f( x)f(x)的变化。也就