核函数

核函数简介根据模式识别理论，低维空间线性不可分的模式通过非线性映射到高维特征空间则可能实现线性可分，但是如果直接采用这种技术在高维空间进行分类或回归，则存在确定非线性映射函数的形式和参数、特征空间维数等问题，而最大的障碍则是在高维特征空间运算时存在的“维数灾难”，采用核函数技术可以有效地解决这样问题。1.直接非线性映射线性回归：我们称该对象有n个属性(attribu...

CHAO_^

1050人浏览 · 2017-05-15 17:36:24

CHAO_^ · 2017-05-15 17:36:24 发布

核函数简介

根据模式识别理论，低维空间线性不可分的模式通过非线性映射到高维特征空间则可能实现线性可分，但是如果直接采用这种技术在高维空间进行分类或回归，则存在确定非线性映射函数的形式和参数、特征空间维数等问题，而最大的障碍则是在高维特征空间运算时存在的“维数灾难”，采用核函数技术可以有效地解决这样问题。

1.直接非线性映射

线性回归：

我们称该对象有n个属性(attribute)，可以将该属性直接作为特征(feature)来使用，也可以将该属性做出映射，例如映射为feature：

而之后在每一个需要使用x的地方以来替代。

2.在含有点积的计算过程中使用核函数

例如在svm分类器中,推导出(只举例，不详述推导过程)：

应此分类函数为：

这里的形式的有趣之处在于，对于新点 x的预测，只需要计算它与训练数据点的内积即可，这就是所谓 Supporting Vector ，所有非Supporting Vector 所对应的系数都是等于零的，因此对于新点的内积计算实际上只要针对少量的“支持向量”，非支持向量的训练数据对超平面没有影响。

原始特征内积为：，依据(1)中的映射，得到映射后的特征内积为：

然而这种计算方式是非常低效的。

定义:

但是该核函数只能在选择该映射函数时才能够等价于映射后特征的内积。

由于计算的是内积：

所以向量之间夹角越小，核函数值越大。

在上述的例子中，通过推导出k(x,z)与Φ(x)的关系来证明该核函数是有效的。那么给定任意一个核函数，如何判断它的有效性呢，也就是说，能否找到一个Φ，使得对于所有的x和z，都满足？

3.核函数的有效性判定

必要条件

假设有n个训练样本，每个样本对应的特征向量为：

计算任意两个样本的核函数值为：

这样可以得到一个n*n的核函数矩阵，该核函数矩阵是一个对称矩阵。

假设核函数是有效的，也就是说满足条件：

那么对于任意向量a：

所以核矩阵为半正定矩阵是该核函数有效的必要条件。

充分条件

Mercer定理表明为了证明K是有效的核函数，那么我们不用去寻找Φ，而只需要在训练集上求出各个Kij，然后判断矩阵K是否是半正定（使用左上角主子式大于等于零等方法）即可。

所以核矩阵为半正定矩阵是该核函数有效的充分必要条件。

4.常见核函数

线性核：

多项式核：

径向基核函数：

点击阅读全文

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

嵌入式作业（七）：基于Ardunio的STM32串口通信

嵌入式作业（七）0作业要求1Ardunio 完成STM32的串口通信（1）安装Ardunio IDE（2）stm32串口通信2关于 stduino IDE0作业要求安装 Ardunio IDE 和相关软件支持库，在Ardunio 完成STM32板子的串口通信程序：（1）持续向串口输出“Hello world！”；（2）当接收到“stop!”时，停止输出。网上有一个国人版的MCU集成开发平台， st

CSDN学习社区

JDBC详解

JDBC文章目录JDBC什么是JDBC?JDBC驱动程序:Java使用JDBC访问数据库的步骤:设置classpath:Oracle连接字符串的书写格式:简单的例子:常用数据库的驱动程序及JDBC URL:Oracle数据库:SQL Server数据库MySQL数据库Access数据库PreparedStatement接口:JNDI-数据源（Data Source）与连接池（Connection

CSDN学习社区

“模式识别与机器学习”学习笔记no2.再谈感知机

接**上篇：上篇主要进行了PLA，Pocket算法的理论过程分析和在给定数据集上利用pocket算法对数据集进行分类学习，得到错分数量最少的分类面。上篇中pocket算法的过程已经进行了编程和测试，框架已经建立了起来，这一篇主要上篇中没有提到或涉及不深的几个问题。1.数据集的构造。上篇是直接使用了题目给的向量，这次来根据正态分布来产生数据集。np.random.normal函数可以根据均值和方差生