【机器学习】分类与回归
机器学习模型接受一定的输入并生成一个输出。根据输出值的类型可将机器学习模型进一步划分为分类(classification)和回归(regression)。如果机器学习模型的输出是离散值(discrete values),例如布尔值,那么我们将其称为分类模型。如果输出是连续值(continuous values),那么我们将其称为回归模型。分类和回归同属于监督学习需要完成的任务。二者区别浅层: 两者
机器学习模型接受一定的输入并生成一个输出。根据输出值的类型可将机器学习模型进一步划分为分类(classification)
和回归(regression)
。
如果机器学习模型的输出是离散值(discrete values)
,例如布尔值,那么我们将其称为分类模型。如果输出是连续值(continuous values)
,那么我们将其称为回归模型。
分类和回归同属于监督学习需要完成的任务。
常用的特征分类方法包括 K 近邻( KNearest Neighbors,KNN) 、朴素贝叶斯( Naive Bayesian Mode,NBM) 、决策树( Decision Trees,DT) 、支持向量机( Support Vector Machine,SVM) 和 BP神 经 网 络 ( Back Propagation Neural Network,BPNN)等。
二者区别
浅层: 两者的的预测目标变量类型不同,连续变量的预测叫回归,离散变量的预测是分类。
中层: 回归问题是定量问题,分类问题是定性问题。
高层: 回归与分类的根本区别在于输出空间是否为一个度量空间。
回归的主要作用是了解两个或多个变量之间是否相关,相关的方向,相关的强度,并利用数学模型以便观察特定变量来预测研究者感兴趣的变量。分类模型是将回归模型输出离散化,分类和回归模型之间存在重要差异。根本上来说分类是关于预测标签,而回归是关于预测数量。
举例:
拿支持向量机举例,分类问题和回归问题都要根据训练样本找到一个实值函数g(x). 分类问题是:给定一个新的模式,根据训练集推断它所对应的类别(label)(如:+1,-1)。也就是使用y=sign(g(x))来推断任一输入x所对应的类别。回归问题的要求是:给定一个新的模式,根据训练集推断它所对应的输出y(实数)是多少。也就是使用y=g(x)来推断任一输入x所对应的输出值。回归问题和分类问题的本质一样,不同仅在于他们的输出的取值范围不同。分类问题中,输出只允许取两个值;而在回归问题中,输出可取任意实数。
更多推荐
所有评论(0)