logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

2022/1/6机器学习之模型评估

一、管道方法简化工作流1.读入数据集:pd.read.csv("+地址“)2.将特征分配给NumPy阵列x,用LabelEncoder将对象分类标签转为整数。3.将数据分为训练集和测试集4.使用make_pipeline函数可以将包含任意多个scikit-learn转换器(支持fit和transform方法作为输入对象),后面接着实现fit以及predict方法的scik-learn评估器。二、

#机器学习#python#sklearn
2022/1/6机器学习之特征统一尺度和避免过拟合的方法

把特征放在同一尺度上1.决策树和随机森林是两种少有的不必担心特征比例调整的机器学习算法(这两种算法不随特征比例的影响)2.大多数其他的机器学习算法和优化算法,在相同特征比例的情况下表现优异。3.两个例子:a.假设有两个特征,一个是1到10的范围,另一个是1到100000范围。Adaline的平方误差函数,算法主要忙于优化误差较大的第二个特征的权重。b.利用欧氏距离度量k–近邻(KNN)算法,样本之

#机器学习#决策树#算法
到底了