
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
dropna()是pandas库中的一个函数,用于删除DataFrame中的缺失值。具体来说,该函数会返回一个新的DataFrame,其中已经将包含删除了缺失值的行或列。
【代码】【深度学习实战】使用卷积神经网络(LeNet-5)对mnist数据集进行多分类。
1. 数据集特征值目标值共569个样本,30维特征。2.代码实现2.1 未调参时的代码及结果# 获取数据集data = load_breast_cancer()# 建模rfc = RandomForestClassifier(n_estimators=100, random_state=90) # 交叉验证rfc_score = cross_val_score(rfc, data.data, da
【机器学习实战】对加州住房价格数据集进行回归预测(线性回归、决策树、随机森林)
【代码】【机器学习实战】分类算法评估之ROC曲线绘制(多模型对比)

结果:R2:EVS:结论: 虽然我们在加利福尼亚房子价值数据集上的MSE相当小,但我们的 却不高,这证明我们的模型比较好地拟合了数据的数值,却没有能正确拟合数据的分布。
1. 数据集 —— 波士顿房价给定的这些特征,是专家们得出的影响房价的结果属性。我们此阶段不需要自己去探究特征是否有用,只需要使用这些特征。到后面量化很多特征需要我们自己去寻找2. 实现2.1 代码from sklearn.datasets import load_bostonfrom sklearn.model_selection import train_test_splitfrom skle
共有30个特征。代码;发现结果一直停在线性函数不动,因为poly作为核函数,要花费很长时间。将poly核函数去掉,结果:如果数据是线性的,那如果我们把degree参数调整为1,多项式核函数应该也可以得到不错的结果:就从框出来的那个地方看,就能看出来数据量钢化差别太大,所以要进行数据标准化。对数据进行标准化以后,再查看数据的分布:结果:可以见到,在rbf作为核函数的结果中精确度已经提高了,跟line
查看X和Y找索引为36000的实例,并将其还原成数字(书中是还原成了5,但是我这么获取数据集还原的数字是9,不知道什么原因)其他评估指标(AUC值、精度、召回率)如下:







