简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
python实现集成算法(随机森林、boosting算法、stacking算法)(小白入门超简单实战)
如果自变量都是一样的,根据相同的自变量去训练多个模型求平均是没有意义的。随机森林:是一种由决策树构成的bagging集成算法,森林指的是很多棵树,随机指的是样本和特征都随机抽取(有放回的随机抽取,保证森林里面的每棵树都是不那么一样的)。stacking代码:(忽略in[]括号里的顺序,按照代码排序运行即可,因为我反复运行程序了导致in[]顺序与代码排序不同):用不同的算法去训练多个模型,把多个模型
皮尔逊相关系数及假设检验
(1)显著水平,就是P值,这是首要的,因为如果不显著,相关系数再高也没用,可能只是因为偶然因素引起的,那么多少才算显著,一般p值小于0.05就是显著了;例如p值=0.001,就是很高的显著水平了,只要显著,就可以下结论说:拒绝原假设无关,两组数据显著相关也说两者间确实有明显关系.通常需要p值小于0.1,最好小于0.05设甚至0.01,才可得出结论:两组数据有明显关系,如果p=0.5,远大于0.1,
到底了