logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【机器学习实战】对加州住房价格数据集进行回归预测(线性回归、决策树)

【机器学习实战】对加州住房价格数据集进行回归预测(线性回归、决策树)

#回归#线性回归
【机器学习实战】随机森林在乳腺癌数据上的调参

1. 数据集特征值目标值共569个样本,30维特征。2.代码实现2.1 未调参时的代码及结果# 获取数据集data = load_breast_cancer()# 建模rfc = RandomForestClassifier(n_estimators=100, random_state=90) # 交叉验证rfc_score = cross_val_score(rfc, data.data, da

#机器学习#随机森林#人工智能 +1
【机器学习实战】利用sklearn中的逻辑回归对癌症分类预测-良/恶性乳腺癌肿瘤预测

1. 数据集数据下载地址:https://archive.ics.uci.edu/ml/machine-learning-databases/数据描述(1)699条样本,共11列数据,第一列用语检索的id,后9列分别是与肿瘤相关的医学特征,最后一列表示肿瘤类型的数值。(2)包含16个缺失值,用”?”标出。2.分析——实现步骤获取数据(读取的时候加上names)数据处理(缺失值)数据集划分特征工程(

#sklearn#机器学习#逻辑回归
【机器学习实战】使用sklearn中的乳腺癌数据集探索SVM的核函数(kernel)的性质

共有30个特征。代码;发现结果一直停在线性函数不动,因为poly作为核函数,要花费很长时间。将poly核函数去掉,结果:如果数据是线性的,那如果我们把degree参数调整为1,多项式核函数应该也可以得到不错的结果:就从框出来的那个地方看,就能看出来数据量钢化差别太大,所以要进行数据标准化。对数据进行标准化以后,再查看数据的分布:结果:可以见到,在rbf作为核函数的结果中精确度已经提高了,跟line

#机器学习#支持向量机#sklearn
【机器学习实战】使用SGD-随机梯度下降、随机森林对MNIST数据进行二分类(Jupyterbook)

查看X和Y找索引为36000的实例,并将其还原成数字(书中是还原成了5,但是我这么获取数据集还原的数字是9,不知道什么原因)其他评估指标(AUC值、精度、召回率)如下:

#随机森林#分类
【机器学习实战】使用sklearn中的PCA对鸢尾花数据集进行特征降维

1.鸢尾花数据集特征目标值2. PCA降维实现将4维特征降维到2维,并对三类目标值对应的x1、x2进行可视化。# 获取数据集iris = load_iris()x = iris.datay = iris.target# 进行PCA降维,建模pca = PCA(n_components=2) # 实例化pca.fit(x) # 拟合模型x_dr = pca.transform(x)# 将三种鸢尾花的

#sklearn#机器学习#python
【机器学习实战】对加州住房价格数据集进行数据清洗

预测器:2.2 书中使用中位数替换这部分的代码可以看原作者发布的jupyter book的源码:02_end_to_end_machine_learning_project.ipynb我对我的数据也将原作者的代码复制过来跑了一下,结果如下:fit_transform() takes 2 positional arguments but 3 were given with LabelBinarize

#机器学习#python#numpy
【机器学习实战】基于代价敏感学习的AdaCost方法用于信用卡欺诈检测

【代码】【机器学习实战】基于代价敏感学习的AdaCost方法用于信用卡欺诈检测。

#学习#python
【机器学习实战】使用sklearn中的LinearRegression或SGDRegressor实现波士顿房价的回归预测

1. 数据集 —— 波士顿房价给定的这些特征,是专家们得出的影响房价的结果属性。我们此阶段不需要自己去探究特征是否有用,只需要使用这些特征。到后面量化很多特征需要我们自己去寻找2. 实现2.1 代码from sklearn.datasets import load_bostonfrom sklearn.model_selection import train_test_splitfrom skle

#机器学习#sklearn#回归 +1
    共 71 条
  • 1
  • 2
  • 3
  • 8
  • 请选择