logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

随机森林分类、回归、调参、特征重要性

训练模型,设置25棵树,计算袋外误差。解释一下袋外数据的概念:有放回抽样,每个样本被抽到的概率是1/n,所以不被抽到的概率是1-1/n,所以n个样本都不被抽到的概率就是:(1-1/n)^n,用洛必达法则化简,这个概率收敛到1/e,约等于0.37。正常来说,只要特征值不要设置的太小,所有特征都会被整个森林抽取到用来训练,所以相对来说这个值对整个模型的影响不是太大,但是这个值越大,单棵树需要考虑的特征

文章图片
#随机森林#分类#回归
到底了