logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

随机森林之信贷风险模型特征工程

信贷风险模型       今天在复习随机森林的时候,突然有了一些思考:信贷风险模型在我的理解,就是为了评估某个客户(企业,个体)在贷款等相关业务中,是否能够有效的将其贷款回收。通过自己的一些了解与猜想,信用评估模型中的主要评价来源是客户的数据。那么,数据可能会存在各种各样的数据,例如其历史借贷信息等。同时,收集的数据肯定会有很多的噪声。所以,如何根据这些特征信息来分析客户的借贷情况就显得尤为重要。

#随机森林
机器学习中,有监督与无监督训练的区别与联系

      简单来说,是否有监督,就看输入是否有标签(label)。监督学习即通过已有的训练样本来训练,从而得到一个最优模型,再利用这个模型将数据样本映射为相应的结果。例如:分类,回归各种算法,SVM, KNN, RF, GBDT等等。 无监督学习如聚类,包括K-Means,模糊c均值等。 ...

到底了