机器学习入门

文章目录一、什么是机器学习1.引入：机器学习的四个任务2.机器学习的分类3.机器学习算法的过程4.没有免费午餐定理二、支持向量机1.介绍2.线性可分与不可分3.支持向量机算法4.支持向量机算法的优化一、什么是机器学习机器学习：非显著式编程——利用收益函数使计算机自动学习机器学习的核心是“使用算法解析数据，从中学习，然后对世界上的某件事情做出决定或预测”。这意味着，与其显式地编写程序来执行某些任务，

学AI的二哈

2440人浏览 · 2021-09-11 15:03:10

学AI的二哈 · 2021-09-11 15:03:10 发布

文章目录

一、什么是机器学习
二、支持向量机

一、什么是机器学习

机器学习：非显著式编程——利用收益函数使计算机自动学习
机器学习的核心是“使用算法解析数据，从中学习，然后对世界上的某件事情做出决定或预测”。这意味着，与其显式地编写程序来执行某些任务，不如教计算机如何开发一个算法来完成任务。

1.引入：机器学习的四个任务

四个机器学习的任务：（前俩者为同一类，划分标准为经验E）

教计算机下棋：强化学习：让计算机通过与环境的互动逐渐强化自己的行为模式

无人驾驶

垃圾邮件的识别：所有的经验E都是由人工采集并输入计算机的，叫做监督学习

人脸识别

2.机器学习的分类

在这里插入图片描述

机器学习算法：监督学习强化学习

监督学习：

传统的监督学习——每一个训练数据都有对应的标签——支持向量机人工神经网络深度神经网络

非监督学习 —— 所有训练数据都没有对应的标签

算法包括：聚类、EM算法、主成分分析

半监督学习 —— 训练数据中一部分有标签，一部分没有标签

监督学习—— 分类和回归

分类：标签是离散的数值

回归：标签是连续的数值

3.机器学习算法的过程

1、特征提取和特征选择

2、不同的算法对特征空间（训练结果）维度和标准做不同的划分

3、获得不同的结果探究不同应用场景下应该采取哪种算法，研究新的机器学习算法以便适应新的场景

4.没有免费午餐定理

在这里插入图片描述

在这里插入图片描述
这个定理表明没有最完美的算法。所有算法都是建立在先验假设的前提下，才有的优劣之分。

二、支持向量机

1.介绍

线性内核多项式核高斯径向基函数核
支持向量机，因其英文名为support vector machine，故一般简称SVM，通俗来讲，它是一种二类分类模型，其基本模型定义为特征空间上的间隔最大的线性分类器，其学习策略便是间隔最大化，最终可转化为一个凸二次规划问题的求解。

2.线性可分与不可分

线性可分：存在一条直线将不同的训练样本分开（二维样本空间）
线性不可分：不存在一条直线将不同的训练样本分开
在这里插入图片描述

给定训练样本集 D = ( x 1 , y 1 ) , ( x 2 , y 2 ) , . . . , ( x m , y m ) ) ) , y i ∈ { − 1 , 1 } ，线性分类器基于训练样本D 在二维空间中找到一个超平面来分开二类样本。当然，这样的超平面有很多。