
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文主要介绍了机器学习系统设计的相关问题。首先通过垃圾邮件分类的例子来展示操作过程,随后介绍了提高精准度和降低错误率的一些方法,以及一些在机器学习开发或应用时的推荐的方法:先通过一个简单的算法来快速的实现目标,随后画出相应的学习曲线便于后续的判断,最后进行误差分析。随后介绍了评估度量值的重要性。为了解决偏斜类问题,引入了查准率和召回率的概念,对于如何在二者之间抉择的问题,应当采用调和平均数对两者进

主要讲了线性回归模型、梯度下降算法以及二者相组合得到的线性回归的梯度下降算法,其中着重介绍了线性回归模型的代价函数中的平方差代价函数,用来表示线性回归模型的拟合程度,其数值越小,拟合的效果就越好。梯度下降的思想是每次朝下降幅度最大的方向前进,直至找到局部最优解,其中梯度下降算法公式中的学习效率α要适中,且在梯度下降过程中不需要修改。线性回归的梯度下降算法由于线性回归代价函数的特殊性,每次必然会找到

本篇文章主要介绍了一种叫做照片 OCR 的机器学习的应用实例,它注重的问题是如何让计算机读出图片中的文字信息,随后我们介绍了流水线的概念;在滑动窗口中通过行人检测和文本检测的例子来说明滑动窗口的作用;在人工数据合成中我们讨论了人工数据合成的两种方法,从零开始生成新数据,或是扩充一个已有的训练集;上限分析是个很有用的工具,可以用来衡量模块,当我们想花精力到某个模块上时,我们可以确定这样做会不会有效果

本文简单的复习了一下机器学习中用到的一些关于矩阵的基本知识,包括矩阵的加法乘法、逆运算、转置等,同时也简单的介绍了一下如何使用Octave计算矩阵的逆。

本篇文章主要介绍了降维的相关内容,以及两个应用:数据压缩可以使得某些算法运行得更快;可视化部分则是将数据画出来并更好的理解他们。在使用 PCA 之前首先要进行数据预处理。PCA 所做的是尝试找到一个面或线,把数据投影到这个面或线上,以便于最小化平方投影误差。主成分数字选择中介绍了一种高效的方法来选择 k。文中总结了 PCA 的主要应用,也指出了两个误区并给出了相应的建议:使用 PCA 来防止过拟合

本文主要介绍了聚类算法的相关内容。首先复习了无监督学习的内容以及聚类算法的应用。其次从直观上介绍了 K 均值算法,以及该算法的规范表达和具体的应用(分离不佳的簇)。在优化目标的部分提到了失真代价函数,同时也对 K 均值算法进行了补充。随机初始化 K 均值算法适用于聚类数目相对较小的聚类方法,有时可以帮助我们找到对数据进行聚类的更好的方法。聚类数量 K 仍然是通过手动、人工输入或者用经验来决定。一种

本文主要介绍了神经网络的相关内容,包括起源、模型的建立、工作原理以及几个直观的实例。神经网络最初是为了模拟人类大脑而建立的,希望可以实现只通过一个算法对不同类型的数据进行处理。在模型的建立中,首先通过逻辑单元来模拟神经元的工作,不同的神经元连接在一起后可以形成神经网络,包含输入层,输出层和隐藏层。神经网络的工作原理实际上就是前向传播,即从输入特征后逐层计算到输出结果。在具体例子中,通过建立逻辑与、

本篇文章主要介绍了推荐系统,首先介绍了推荐系统问题的主要形式;在基于内容的推荐算法中介绍了如何将变量应用到线性回归中来预测不同用户对不同电影的评级;在协同过滤中介绍了一个方法来做推荐系统,它不是基于内容的,并且不假设已经得到这些所有的电影的特征;随后介绍了协同过滤算法,它可以同时学习几乎所有电影的特征和所有用户参数;在低秩矩阵分解中介绍了如何使用一个向量化的实现来计算所有用户对所有电影的评分预测值

本篇文章主要介绍了异常检测,首先直观描述了问题,随后定义了异常检测;高斯分布部分介绍了高斯函数的图像特征以及如何用其拟合数据;算法部分我们讨论了如何估计p(x)的值使来开发异常监测的算法;开发和评估异常检测系统中介绍了划分带标签和无标签的数据的方法;开发和评估异常检测系统中介绍了评估一个异常检测算法的步骤;特征选择中介绍了如何选择特征以及对特征进行转换;多元高斯分布最重要的优势就是可以描述两个特征









