
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
数据准备有收集数据、探索数据、数据预处理三个步骤。这一章我们重点讲解如何挖掘数据的有效信息以及如何对数据进行预处理,以便从加工后的数据中提取特征,为模型学习打?坚实的基础。在信息化时代,数据逐渐成为现代社会基础设施的一部分,就像日常生活中不可或缺的水、电、公路、通信网络一样。同时因互联网的快速普及,全球数据量正呈现出指数级的爆炸式增长。弗雷斯特研究公司的公开研究结果表明,目前金融交易、社交媒体、G

4.5.1 梯度下降原理求解这个凸函数的最低点通常采用“梯度?降法”。构造损失函数,把求解最优参数θ的问题变成求解损失函数最小值的问题,便可以用梯度?降法求解。梯度?降法是调整参数θ使得损失函数J(θ)取得最小值的最基本方法之一。从图像上看,就是在碗状结构的凸函数上取一个初始值,然后沿着楼梯一步步挪动这个值,直到?降到最低点。梯度?降法的求解过程就像是一个旅客?山的场景。如图 4-16 所示,假设

9.1.1 三个臭皮匠赛过诸葛亮中国有句俗语叫“三个臭皮匠赛过诸葛亮”。意思是三个才能平庸的人,若能同心协力,比诸葛亮还要厉害!这就是我们常说的“博采众长”。在机器学习领域,也有这么一种算法,它本身不是一个单独的学习算法,而是一种构建并结合多个学习器来完成学习任务的算法。这种算法被称为“集成学习”(Ensemble Learning)。集成学习已经成为各类机器学习竞赛的首要选择,也可以说是人工智能

9.3.1 Bagging是什么Bagging是Bootstrap aggregating的缩写,翻译成中文为“套袋”,其同样是一类算法的统称。这类算法的主要特点是采用随机、可被重复选择的方式挑选训练集,然后“并行”构造弱学习器,最后通过结合方式生成强学习器。在 Boosting 算法中,各个弱学习器之间存在依赖关系,?一个学习器依赖上一个学习器的学习结果去调整参数,是一种“串行”结构;但是在Ba

11.2.1 卷积运算因为运算能力受到了限制,所以只有运算量小的方法才有可能提取图像的特征。仔细思考我们会发现,图像特征的表现有一个很显然的特点,就是在图像中特征边缘的像素点的颜色通常都是变化较大的 。实际上我们没有必要扫描整幅图像来学习特征,只需要找到这些边缘变化大的地方就能够发现物体的特征。于是我们从数学领域寻找有没有合适的方法能够帮助我们表达像素变化较大的边缘,如果能找到这样的方法就能够通过

2.2.1 如何进行特征工程.用于机器学习的数据源一般有两种:一种是业务部门直接提供的数据,或者根据需要在网络上爬取的数据。这种数据称为原始数据,通常存在较多的问题,需要通过数据预处理整理数据并且找出解决问题所需要的特征;另一种是对原始数据进行组合加工构建的高级特征数据,构建高级特征的过程称为特征工程。接?来我们学习如何挖掘特征与特征之间的联系,组合出高级特征。特征工程的本质是数据转化。原始数据通

上一节讲述了SVM的硬间隔最大化算法。它对线性可分的数据集有较好的处理效果,但是对线性不可分的数据集则显得束手无措。那么,当面对线性不可分的数据集时,我们该如何处理呢?回顾第4章中的线性回归算法,我们也遇到过类似的场景。当时我们的解决方法是将低维非线性的数据集映射到高维,数据就变成线性可分的了。这也启发了我们,对于线性不可分的低维数据集,如果想要使用 SVM 算法,则可以将其映射到高维,使得线性不

1.3.1 机器学习的三个阶段学习了机器学习的概念后,我们知道机器学习实际上就是计算机通过算法处理数据并且学得模型的过程。“模型”这个词经常被我们挂在嘴边,但大部分人仍然不清楚模型是怎么做出来的,模型在计算机里是怎么表示的,对模型很难有一个具象的认识。实际上模型主要完成转化的工作,帮助我们将一个在现实中遇到的问题转化为计算机可以理解的问题,这就是我们常说的建模 。如图1-6所示,在机器学习中生成一

早在40年前,图像识别领域就有很多关于人脸识别的研究。但是在当时,传统算法在普通图像识别中已经很难取得良好的识别效果,更何况还要从人脸中提取更加细微的特征。在很长一段时间里,人脸识别主要存在过拟合与欠拟合两个问题。一方面是因为不同的人脸之间的差别只有五官上细微的差异,这要比区分飞机、桌子的照片更难。因为后者的特征差异明显,比较容易判断,而模型容易将长得很像的两个人误判为同一个人;另一方面是同一个人

机器学习不是万能的,不能解决所有的问题。机器学习擅长的是通过已知经验找到规律去解决问题。如果我们面对的问题没有任何规律可循,完全是一个随机事件,那么使用再复杂的机器学习算法也无济于事 。值得注意的是,很多问题看似没有规律,实际上是人类处理不了太大的数据量,看起来杂乱的数据掩盖了背后的规律,这类问题并非无迹可寻,只是需要用正确的方法。所以面对问题,产品经理首先要分析可行性,想清楚数据背后的关联关系,








