
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
一、评测标准模型的测评标准:分类的准确度(accuracy);预测准确度 = 预测成功的样本个数/预测数据集样本总数;二、超参数超参数:运行机器学习算法前需要指定的参数;kNN算法中的超参数:k、weights、P;一般超参数之间也相互影响;调参,就是调超参数; 1)问题 # 以kNN算法为例平票:如果k个点中,不同类型...
老师:非参数学习的算法都容易产生过拟合;一、决策树模型的创建方式、时间复杂度 1)创建方式决策树算法既可以解决分类问题,又可以解决回归问题;CART 创建决策树的方式:根据某一维度 d 和某一个 阈值 v 进行二分;(得到的是一个二叉树)scikit-learn 中的创建决策树的方式:CART(Classification And Regres...
一、概述现实中的数据一般有噪声、数量庞大并且可能来自异种数据源。数据集由数据对象组成,一个数据对象代表一个实体。数据对象:又称样本、实例、数据点或对象。数据对象以数据元组的形式存放在数据库中,数据库的行对应于数据对象,列对应于属性。属性是一个数据字段,表示数据对象的特征,在文献中,属性、维度(dimension)、特征(feature)、变量(variance)可...
一、概述对应成功的数据预处理而言,把握数据的全貌至关重要。基本统计描述可以用来识别数据的性质,凸显哪些数据值应该视为噪声或离群点。二、中心趋势度量:均值、中位数、众数、中列数也就是度量数据分布的中部或中心位置。(给定一种属性,它的值大部分落在何处)频率:区间内数值的个数。 1)均值(mean)数据集“中心”的最常用、最有效的数值度量是...
一、基础理解 1)定义ROC(Receiver Operation Characteristic Curve)定义:描述 TPR 和 FPR 之间的关系;功能:应用于比较两个模型的优劣;模型不限于是否通过极度偏斜的数据训练所得;比较方式:ROC 曲线与坐标图形边界围成的面积,越大模型越优;TPR(True Pos...
一、基础理解LASSO 回归(Least Absolute Shrinkage and Selection Operator Regression)是模型正则化的一定方式;功能:与岭回归一样,解决过拟合或者模型含有的巨大的方差误差的问题;二、LASSO 回归以线性回归为例 1)对于岭回归任务:让最小化的损失函数对应的θ 值尽量的...
一、中位数定义/解释:按顺序排列的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比他大,有一半的数据比他小 #如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。二、方差参考百科:方差 1)定义 方差(variance):是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量 2)应用 1、在...
一、什么是偏差和方差偏差(Bias):结果偏离目标位置;方差(Variance):数据的分布状态,数据分布越集中方差越低,越分散方差越高;在机器学习中,实际要训练模型用来解决一个问题,问题本身可以理解为靶心,而模型就是子弹,则子弹呈现在靶子上弹孔位置就可能出现偏差和方差的情况,也就是说训练出的模型可能犯偏差和方差两种错误;二、...
一、scikit-learn 中的多项式回归 1)实例过程模拟数据import numpy as npimport matplotlib.pyplot as pltx = np.random.uniform(-3, 3, size=100)X = x.reshape(-1, 1)y = 0.5 * x**2 + x + np.random.no...
一、决策树思维、决策树算法 1)决策树思维决策树思维是一种逻辑思考方式,逐层的设定条件对事物进行刷选判断,每一次刷选判断都是一次决策,最终得到达到目的;整个思考过程,其逻辑结构类似分叉的树状,因此称为决策树思维;例一:公式招聘时的决策树思维此过程形成了一个树的结构,树的叶子(录用 / 考察)节点位置是做出的决定,也可以理解为是对输出(也就是应聘者的信息)的分类:录...







