
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
在样本空间中,划分超平面可通过如下线性方程来描述其中为法向量,决定了超平面的方向;为位移项,决定了超平面与原点之间的距离。样本空间中任意点到超平面的距离为假设超平面能将样本正确分类,即对于,若,则有;若,则有。我们把使得当时,的样本点,以及使得当时,的样本点称为“支持向量”,两个异类支持向量到超平面的距离之和为它被称为“间隔”。欲找到具有“最大间隔”划分的超平面,也就是要找到能满足约束条件的参数和
目录1 特征工程是什么?2 数据预处理2.1 无量纲化2.1.1 标准化2.1.2 区间缩放法2.1.3 标准化与归一化的区别2.2 对定量特征二值化2.3 对定性特征哑编码2.4 缺失值计算2.5 数据变换3 特征选择3.1 Filter3.1.1 方差选择法3.1.2 相关系数法3.1.3 卡方检验3.1.4 互信息法3.2 Wrapper3.2.1 递归特征消除法3.3 Embedded3
在“M-P神经元模型”中,神经元接收到来自个其他神经元传递过来的输入信号,这些输入信号通过带权重的连接进行传递,神经元接收到的总输入值将与神经元的阈值进行比较,然后通过“激活函数”处理以产生神经元的输出。常用Sigmoid函数作为激活函数。把许多个这样的神经元按一定额层次结构连接起来,就得到了神经网络。事实上,从计算机科学的角度看,我们可以先不考虑神经网络是否真的模拟了生物神经网络,只需将一个神经
逻辑回归—考虑二分类任务,其输出标记,而线性回归模型产生的预测值是实值,于是,我们需将实值转换为0/1值。最理想的是“单位阶跃函数”,即若预测值大于零就判为正例,小于零则判为反例,等于零则可任意判别。但是单位阶跃函数不连续,不便于求导估计参数值。于是我们希望找到能在一定程度上近似单位阶跃函数的“替代函数”,并希望它单调可微。Sigmoid函数它将值转化为一个接近0或1的值,并且其输出在附近变化很陡
线性回归—它试图学得我们通过“均方误差”,即最小化的过程,称为线性回归模型的最小二乘“参数估计” 。分别对和求导,得到,,然后令它们等于零可得到和最优解的闭式解,,其中为的均值。更一般的情形是在数据集中样本由个属性描述。此时我们试图学得,这称为“多元线性回归”。类似的,可利用最小二乘法的矩阵形式来对和进行计算得到它们最优解的闭式解。然而现实任务中我们可能解出多组和,从而得到多个模型,选择哪一个模型
在“M-P神经元模型”中,神经元接收到来自个其他神经元传递过来的输入信号,这些输入信号通过带权重的连接进行传递,神经元接收到的总输入值将与神经元的阈值进行比较,然后通过“激活函数”处理以产生神经元的输出。常用Sigmoid函数作为激活函数。把许多个这样的神经元按一定额层次结构连接起来,就得到了神经网络。事实上,从计算机科学的角度看,我们可以先不考虑神经网络是否真的模拟了生物神经网络,只需将一个神经
#导入包from sklearn.cluster import KMeansX = [[0.0888, 0.5885], [0.1399, 0.8291], [0.0747, 0.4974], [0.0983, 0.5772], [0.1276, 0.5703],[0.1671, 0.5835], [0.1906, 0.5276], [0.1061, 0.5523], [0.2446, 0.400







