logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

命令行更新scikit-learn

使用pip命令更新库pip install --upgrade 库名 比如更新scikit-learn包pip install --upgrade scikit-learnpip更新Python  -m pip install --upgrade pip

特征共线性问题分析

1.概念:多重共线性是指自变量之间存在一定程度的线性相关,会给变量对模型的贡献性带来影响。即若有两个变量存在共线性,在相互作用计算后,其一的变量的影响会相对减弱,而另一个变量的作用却会相对增强。2.产生原因:(1)没有足够多的样本数据(2)选取的样本之间本身就客观存在共线性关系(3)其他因素导致:数据采集所采用的方法,模型的设定,一个过度决定的模型多数研究者认为特征共线性本

数据挖掘竞赛预测模型——贝叶斯参数搜索

bayes_opt库实现贝叶斯自动调参本案例使用xgboost算法实现bayes_opt自动搜索调参import pandas as pdimport xgboost as xgbfrom sklearn.model_selection import cross_val_scorefrom bayes_opt import BayesianOptimizationtrain_d...

数据挖掘竞赛预测模型一——逻辑回归

逻辑回归sklearn中主要有LogisticRegression和LogisticRegressionCV:LogisticRegressionCV使用交叉验证选择正则化参数C,而LogisticRegression需要每次手动指定一个正则化参数#LogisticRegressionfrom sklearn.linear_model import LogisticRegression...

#逻辑回归
数据挖掘竞赛预测模型二——SVM

分类预测SVCfrom sklearn.svm import SVCsvm = SVC(C=1, kernel='rbf', degree=3, gamma='auto', class_weigth=None)svm.fit(train_data,train_label)test_pred = svm.predict(test_data)参数:(1)C:惩罚参数(0.0001-...

数据挖掘竞赛预测模型——GridSearch参数网格搜索

本案例使用lightGBM算法实现参数网格搜索import pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.model_selection import GridSearchCVimport lightgbm as lgbtrain_data = pd.read_csv('.....

docker报错

容器安装报错(1)从源安装docker-ce时,报错依赖包问题依赖包有问题,执行apt --fix-broken install,然后再安装apt-get install docker-ce(2)从源安装docekr-ce时,报错使用其他内核文件信息查看错误报告,需要使用到内核头文件,显示还是使用的之前的内核驱动文件,发现现在正在使用的内核驱动文件build没有软连接。将源码拷贝到116机器上,建

#docker
CRIU解析

CRIU1.CRIU定义CRIU,全称checkpoint/restore in userspace,是运行在Linux操作系统上的一个软件工具,在用户空间实现checkpoint/restore功能。使用CRIU可以冻结一个正在运行的程序,并且checkpoint到程序关联的一系列文件,然后用这些文件在任何主机上重新恢复这个程序被冻结时的那个点,换句话说,也就是对正在运行程序环境的一个备份与恢复

#docker
数据挖掘竞赛预测模型——五折交叉验证

使用catboost进行五折交叉验证import numpy as npimport pandas as pdimport catboost as cbtfrom sklearn.metric import f1_scorefrom sklearn.model_selection import train_test_splitfrom sklearn.model_selection...

到底了