简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了余弦自动编码器(CosineAutoencoder,CosAE),这是一种新颖的通用自动编码器,它将经典傅里叶级数与前馈神经网络无缝结合。CosAE将输入图像表示为一系列二维余弦时间序列,每个序列由一组可学习的频率和傅里叶系数构成的元组定义。该方法与传统自动编码器形成鲜明对比,传统自动编码器在降低分辨率的瓶颈潜在空间中往往会牺牲细节。而CosAE在其瓶颈层对频率系数(即幅度和相位)进行编
之前介绍了利用 Mobinet V1 做特征提取,从 Tensorflow 的官网上看, Mobilenet V2 的性能比 V1 要更好,今天介绍用 V2 的预训练模型提取特征的方式,基本和 V1 是一样的,只是有一个地方需要注意一下,就是加载网络结构的时候:with tf.contrib.slim.arg_scope(mobilenet_v2.training_scope(is_traini.
今天,我们介绍机器学习里非常常用的一个概念,KL 散度,这是一个用来衡量两个概率分布的相似性的一个度量指标。我们知道,现实世界里的任何观察都可以看成表示成信息和数据,一般来说,我们无法获取数据的总体,我们只能拿到数据的部分样本,根据数据的部分样本,我们会对数据的整体做一个近似的估计,而数据整体本身有一个真实的分布(我们可能永远无法知道),那么近似估计的概率分布和数据整体真实的概率分布的相似度,或者
在机器学习,模式识别中,我们做分类的时候,会用到一些指标来评判算法的优劣,最常用的就是识别率,简单来说,就是acc=Npre/Ntotalacc=N_{pre}/N_{total}这里的 NpreN_{pre}表示预测对的样本数,NtotalN_{total}表示测试集总的样本数。识别率有的时候过于简单, 不能全面反应算法的性能,除了识别率,还有一些常用的指标,就是我们要介绍的
今天介绍 IJCV 2013 年的一篇文章,Selective Search for Object Recognition,这个是后面著名的DL架构 R-CNN 的基础,后续介绍 R-CNN 的时候,会发现 R-CNN 和这篇文章里介绍的算法非常类似。做模式识别的人都知道,目标识别与目标检测是两个不同的东西,目标检测比目标识别要难得多,目标识别可以看做是一个分类问题,给定一张测试图,我们只要判断这
博客专栏:机器学习PDF 文档下载地址:Machine Learning 学习笔记机器学习 scikit-learn 图谱人脸表情识别常用的几个数据库机器学习 F1-Score, recall, precision机器学习 DeepDreaming with TensorFlow (三)机器学习 DeepDreaming with TensorFlow (二)机器学习 DeepDre...
scikit-learn 是机器学习领域非常热门的一个开源库,基于Python 语言写成。可以免费使用。网址: http://scikit-learn.org/stable/index.html上面有很多的教程,编程实例。而且还做了很好的总结,下面这张图基本概括了传统机器学习领域的大多数理论与相关算法。我们可以看到,机器学习分为四大块,分别是 classification (分类), clust
今天,我们介绍机器学习里非常常用的一个概念,KL 散度,这是一个用来衡量两个概率分布的相似性的一个度量指标。我们知道,现实世界里的任何观察都可以看成表示成信息和数据,一般来说,我们无法获取数据的总体,我们只能拿到数据的部分样本,根据数据的部分样本,我们会对数据的整体做一个近似的估计,而数据整体本身有一个真实的分布(我们可能永远无法知道),那么近似估计的概率分布和数据整体真实的概率分布的相似度,或者
今天介绍向量空间中的投影,以及投影矩阵。假设空间中有两个向量 a,b\mathbf{a}, \mathbf{b}a,b,b\mathbf{b}b 在 a\mathbf{a}a 上的投影为 p\mathbf{p}p,我们要计算出 p\mathbf{p}p 到底是多少,如下图所示:为了计算 p\mathbf{p}p,我们可以先假设 p=xa\mathbf{p} = x \mathbf{a}p=x...
今天介绍数值计算和优化方法中非常有效的一种数值解法,共轭梯度法。我们知道,在解大型线性方程组的时候,很少会有一步到位的精确解析解,一般都需要通过迭代来进行逼近,而 PCG 就是这样一种迭代逼近算法。我们先从一种特殊的线性方程组的定义开始,比如我们需要解如下的线性方程组:Ax=bAx=b\mathbf{A} \mathbf{x} = \mathbf{b}这里的 A(n×n)A...