
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
2022/1/6机器学习之模型评估
一、管道方法简化工作流1.读入数据集:pd.read.csv("+地址“)2.将特征分配给NumPy阵列x,用LabelEncoder将对象分类标签转为整数。3.将数据分为训练集和测试集4.使用make_pipeline函数可以将包含任意多个scikit-learn转换器(支持fit和transform方法作为输入对象),后面接着实现fit以及predict方法的scik-learn评估器。二、
2022/1/6机器学习之特征统一尺度和避免过拟合的方法
把特征放在同一尺度上1.决策树和随机森林是两种少有的不必担心特征比例调整的机器学习算法(这两种算法不随特征比例的影响)2.大多数其他的机器学习算法和优化算法,在相同特征比例的情况下表现优异。3.两个例子:a.假设有两个特征,一个是1到10的范围,另一个是1到100000范围。Adaline的平方误差函数,算法主要忙于优化误差较大的第二个特征的权重。b.利用欧氏距离度量k–近邻(KNN)算法,样本之
到底了