机器学习

术语“机器学习”或简称ML(Machine Learning),是亚瑟·塞缪尔(Arthur Samuel)在1959年用机器解决跳棋游戏的背景下提出的。该术语指的是一种计算机程序,它可以学习产生一种行为,而这种行为不是由程序的作者明确编程实现的。相反,它能够显示出作者可能完全没有意识到的行为

这种行为的学习基于三个因素:

  1. 程序消耗的数据;

  2. 量化当前行为和理想行为之间的误差或某种形式的距离的度量;(日常生活中所说的"量化":指的是目标或任务具体明确,可以清晰度量。)

  3. 使用量化误差指导程序在后续事件中产生更好行为的反馈机制。

可以看出,第二个和第三个因素很快使这个概念变得抽象,并强调其深层的数学根源。机器学习理论中的方法对于构建人工智能系统至关重要。

机器学习算法大致分为三种类型:

  1. 监督学习算法

  2. 无监督学习算法

  3. 半监督学习算法

  4. 强化学习算法

让我们详细了解每种类型。

图片

监督学习 

这里写图片描述

为简单起见,让我们将机器学习系统看作一个黑盒(看不见内部运作),在给定一些输入时会产生些输出。如果我们已经有一个历史数据,该历史数据包含一组输入的一组输出,则基于这些数据的学习称为监督学习。

监督学习的一个经典示例是分类。假设我们已经测量了3种不同类型的花( Setosa山鸢尾、 Versicolor变色鸢尾、 Virginica弗吉尼亚鸢尾)的4种不同的属性(尊片长度、尊片宽度、花瓣长度和花瓣宽度)。

我们对每种花的25种不同示例进行了测量。然后,这些数据将用作训练数据,其中有可用于训练模型的输入(4个测量的属性)和相应的输出(花的类型)。然后以监督的方式训练合适的机器学习模型。一旦模型被训练好,就可以根据萼片和花瓣的尺寸对任何花(在三种已知类型之间)进行分类。

无监督学习

这里写图片描述

在无监督学习范式中,标记数据是不可用的。无监督学习的一个经典例子是“聚类”。考虑与前面小节中描述的相同示例,在该示例中,我们对三种类型的花的萼片和花瓣尺寸进行了测量。但是,在本例中,我们没有每组测量的花的确切名称。我们所拥有的只是一组测量值。此外,我们被告知这些测量值属于三种不同类型的花。

在这种情况下,可以使用无监督学习技术自动识别三组测量值(所属的)类簇。但是,由于标签未知,我们所能做的就是将每个类簇称为flower-type-1、flower-type-2和flower-type-3。如果给出一组新的测量值,我们可以找到它们最接近的类簇,并将它们归类为其中之一。

半监督学习 

在此学习方式下,输入数据部分被标识部分没有被标识,这种学习模型可以用来进行预测,但是模型首先需要学习数据的内在结构以便合理的组织数据来进行预测。应用场景包括分类和回归,算法包括一些对常用监督式学习算法的延伸,这些算法首先试图对未标识数据进行建模,在此基础上再对标识的数据进行预测。如图论推理算法(Graph Inference)或者拉普拉斯支持向量机(Laplacian SVM.)等。

强化学习

这里写图片描述

强化学习是一种特殊的学习方法,需要与监督和无监督方法分开对待。强化学习涉及来自环境的反馈,因此它并不是完全无监督的,但是,它也没有一组可用于训练的标记样本,因此不能将其视为有监督的。在强化学习方法中,系统不断地与环境进行交互以寻求产生期望的行为,并从环境中获取反馈。

图片

划分机器学习方法的另一种方式是根据它们处理的数据类型进行分类:

1,静态学习

2,动态学习

静态学习

接收静态标记数据的系统称为静态学习方法。处理随时间不断变化的数据的系统称为动态方法。每种方法都可以是有监督的,也可以是无监督的,但是,强化学习方法始终是动态的。

静态学习是指对作为单个快照获取的数据进行学习,并且数据的属性随时间保持不变。一旦在数据上训练了模型(使用监督学习或无监督学习),就可以在将来的任何时间将训练后的模型应用于类似的数据,而且该模型仍然有效,并将按预期执行。典型的例子是不同动物的图像分类。

动态学习

这也称为基于时间序列的学习。这类问题中的数据对时间敏感,会随着时间不断变化。因此,模型训练不是一个静态的过程,而是需要不断地(或在每个合理的时间窗口之后)对模型进行训练,以保持有效。

此类问题的典型例子是天气预报或股票市场预测。一年前训练过的模型对于预测明天的天气或预测明天任何股票的价格将完全无用。两种类型的根本区别在于状态的概念。在静态模型中,模型的状态是不变的,而在动态模型中,模型的状态是时间的函数,它在不断变化。

图片

结语监督学习是有数据有结论 (花的尺寸,花的种类)输入花的尺寸就知道花的种类。

          无监督学习是有数据无结论(只有花的尺寸)输入花的尺寸只会分类,不知其种类,需在输入多组已知种类数据并归                    类后才可知其种类。

          强化学习即类似于无监督学习,有类似于监督学习,他与环境进行交互,获得反馈,从而改进自己。

        静态学习接受的数据是静态的,随时间不发生改变

        动态学习接受的数据是动态的,随时间而发生改变

记得关注我哦!!给个赞吧!!!

本文截取于博主每日一书,如有侵权,请联系

今日一笑:古时掌上电脑》

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐