yuxj记录学习个人主页

@weixin_41907245

yuxj记录学习

2022-11-25 15:01:10 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习-sklearn模型选择和最优参数选择

写在前言当你决定调用sklearn中提供的模型去做回归或分类等操作的时候，在不考虑数据优劣的情况下，你就只能依赖sklearn中提供模型和对应模型参数来进行拟合和参数优化来达到最后的最优结果，这个时候大部分人就会处在我到底选择哪个模型，选择了模型之后我模型参数我该怎么选什么的纠结之中，因为一个模型的选择和参数的选择就决定了你的结果的上限是什么。比如，你现在要做一个二分类预测，手里有10w左右的数据

#sklearn #机器学习

机器学习-随机森林(RandomForest)详解

1.什么是随机森林随机森林就是通过集成学习的思想将多棵树集成的一种算法，它的基本单元是决策树，而它的本质属于机器学习的一大分支——集成学习（Ensemble Learning）方法。解读下上面的话：1.随机森林属于集成算法，属于集成算法中的bagging，另一种就是boosting了，集成意味着着该算法是多个算法组合而成2.随机森林是由决策树集成的，这个很好理解，单木为树，多木成林...

#机器学习 #算法 #sklearn +1

linux搭建pyspark环境，本地pycharm使用远程连接

#pycharm #linux #python

Pyflink教程(三)：自定义函数

pyflink

#学习

机器学习特征选择-使用假设检验法

#使用假设检验法import statsmodels.api as smY = df1["总价"].valuesX = df1[["建筑面积","室","厅","卫","中装修","毛坯","精装修","豪华装修","东","东北","东南","南","西","西北","西南","低层","高层"]]X_ = sm.add_constant(X)#使用最小平方法result = sm...

Pyflink教程(五)：连接mysql

pyflink-mysql

#mysql

机器学习-sklearn模型选择和最优参数选择

#sklearn #机器学习

机器学习特征选择-逻辑回归RandomizedLogisticRegression

data = pd.read_excel(filename)x = data.iloc[:,:8].as_matrix()y = data.iloc[:,8].as_matrix()from sklearn.linear_model import LogisticRegression as LRfrom sklearn.linear_model import RandomizedLog...

#逻辑回归

数据的归一化处理和标准化处理

#值的归一化处理 1) 数据为什么做归一化处理解析：假设一个神经元有两个输入分别是x1和x2，权重分别是w1和w2，那么该神经元的信号加权求和为x1w1+x2w2。再假设x1属于[0~1]，x2属于[100~1000]，那么x2远远大于x1，那么x1w1就可以忽略不计，整个加权求和就只由x2w2来决定，小的信号就被淹没了！所以需要将x1和x2都要做数据归一化处理避免造...

机器学习-sklearn模型选择和最优参数选择

#sklearn #机器学习

共 15 条

请选择