
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
特征工程----特征提取1、特征提取将任意数据(如文本图像)转换为可用于机器学习的数字特征2、特征提取分类:字典特征提取(特征离散化)文本特征提取图像特征提取(深度学习将介绍 )3、apisklearn.feature.extraction4、字典特征提取字典特征提取就是对类别数据进行转换api:sklearn.feature_extraction.DictVectorizer(sparse=Tr
Facebook签到位置流程分析:1、获取数据集2、基本数据处理2.1 缩小数据范围2.2 选择时间特征2.3 去掉签到较少的地方2.4 确定特征值和目标值2.5 分割数据集3、特征工程—特征预处理(标准化)4、机器学习—knn+cv5、模型评估...
特征工程----特征提取1、特征提取将任意数据(如文本图像)转换为可用于机器学习的数字特征2、特征提取分类:字典特征提取(特征离散化)文本特征提取图像特征提取(深度学习将介绍 )3、apisklearn.feature.extraction4、字典特征提取字典特征提取就是对类别数据进行转换api:sklearn.feature_extraction.DictVectorizer(sparse=Tr
欠拟合与过拟合欠拟合在训练集上表现不好,在测试集上表现不好解决方法:继续学习1、添加其他特征项2、添加多项式特征过拟合在训练集上表现好,在测试接上表现不好解决方法:1、重新清洗数据集2、增大数据的3、正则化4、减少特征纬度...
Facebook签到位置流程分析:1、获取数据集2、基本数据处理2.1 缩小数据范围2.2 选择时间特征2.3 去掉签到较少的地方2.4 确定特征值和目标值2.5 分割数据集3、特征工程—特征预处理(标准化)4、机器学习—knn+cv5、模型评估...
特征工程----特征提取1、特征提取将任意数据(如文本图像)转换为可用于机器学习的数字特征2、特征提取分类:字典特征提取(特征离散化)文本特征提取图像特征提取(深度学习将介绍 )3、apisklearn.feature.extraction4、字典特征提取字典特征提取就是对类别数据进行转换api:sklearn.feature_extraction.DictVectorizer(sparse=Tr
欠拟合与过拟合欠拟合在训练集上表现不好,在测试集上表现不好解决方法:继续学习1、添加其他特征项2、添加多项式特征过拟合在训练集上表现好,在测试接上表现不好解决方法:1、重新清洗数据集2、增大数据的3、正则化4、减少特征纬度...
特征工程----特征提取1、特征提取将任意数据(如文本图像)转换为可用于机器学习的数字特征2、特征提取分类:字典特征提取(特征离散化)文本特征提取图像特征提取(深度学习将介绍 )3、apisklearn.feature.extraction4、字典特征提取字典特征提取就是对类别数据进行转换api:sklearn.feature_extraction.DictVectorizer(sparse=Tr
交叉验证与网格搜索1、交叉验证1.定义:将拿到的训练数据,分为训练和验证集N折交叉验证2.分割方式:训练集:训练集+验证集测试集:测试集3.为什么需要交叉验证为了让被评估的模型更加准确可信注意:交叉验证不能提高模型的准确率2、网格搜索超参数:sklearn中,需要手动指定的参数,叫做超参数网格搜索就是把这些超参数的值,通过字典的形式传递进去,然后进行选择最优值3、APIestimator = Gr
决策树APIsklearn.tree.DecisionTreeClassifier(criterion=‘gini’, max_depth=None, random_state=None)参数:criterion:特征选择标准min_samples_split内部节点再划分所需最小样本数min_samples_leaf叶子节点最小样本数max_depth决策树最大深度1、流程分析:1.获取数据2.