趁着开学前,计划入门机器学习,选择了coursera吴恩达老师的机器学习课程。

(如果打开视频看不了解决方法访问:https://www.cnblogs.com/marsggbo/p/7625575.html

1、初识机器学习

机器学习的应用已经渗透了很多方面,如google搜索引擎苹果的图片识别,垃圾邮件过滤器,淘宝的推荐等等。

两种提出的机器学习的定义:

Arthur Samuel将其定义为:“在特定编程的情况下,给予计算机学习能力的领域”。这是一个较旧的,非正式的定义。

Tom Mitchell提供了一个更现代的定义:“一个程序被认为能从经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验E后,经过P评判,程序在处理T时的性能有所提升。“

例如:玩跳棋。

E =下棋者的经验

T =下棋的任务。

P =该程序将赢得比赛的概率。

在一般情况下,任何机器学习问题可以被分配到两大类别之一:

监督学习(Supervised Learning)和无监督学习(Unsupervised Learning)。

2、监督学习(Supervised Learning)

在监督学习中,我们给出了一个数据集,并已经知道了我们的正确的输出应该是什么样子,并且认为输入和输出之间存在关系。

监督学习问题被分为为“回归(regression)”和“分类(classification)”问题。在回归问题,我们试图在连续输出中预测的结果,这意味着我们正在尝试输入变量映射到一些连续函数。在分类问题,我们不是试图预测离散输出结果。换句话说,我们正试图输入变量映射到不同的类别。

列子1:基于房地产市场规模数据,试图预测它们的价格,价格是一个连续值输出,所以这是一个回归问题。

列子2:给定一个带有肿瘤的患者,试图预测肿瘤是良性还是恶性,是一个离散值的输出,这是一个分类问题。

3、无监督学习(Unsupervised Learning)

无监督学习使我们能够在几乎不知道或者根本不知道结果应该是什么样子的情况下解决问题。我们能够从不需要知道变量影响的数据中得到结构。我们可以根据数据中变量之间的关系对数据进行聚类,得到这种结构。

在无监督学习中,没有基于预测结果的反馈。 

聚类(Clustering):收集100万个不同的基因,并找到一种方法自动将这些基因分组,这些基因在某种程度上与不同的变量(如寿命、位置、角色等)相似或相关。

非聚类(Non-clustering):“鸡尾酒会算法”,让你在混乱的环境中找到结构。(例如,在鸡尾酒会上从一堆声音中辨别出个人的声音和音乐)。

 

 

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐