
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
常用的特征选择方法
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录结论1、读数据,定义测试函数2、各种方法如下1.递归消除特征2.Embedded嵌入法3.相关性过滤之互信息法4.相关性过滤之F检验5.相关性过滤之F检验6.方差过滤总结结论过滤法更快速,但更粗糙。包装法和嵌入法更精确,比较适合具体到算法去调整,但计算量比较大,运行时间长。当数据量很大的时候,优先使用方差过滤和互信息法调整,再
Boruta特征筛选
文章目录前言Boruta介绍1.读入数据2.利用筛选的特征进行建模总结前言Boruta介绍- Boruta算法是一种特征选择方法,使用特征的重要性来选取特征网址:https://github.com/scikit-learn-contrib/boruta_py安装:pip install Boruta提示:以下是本篇文章正文内容1.读入数据代码如下(示例):import numpy as npfr
风控模型大数据挖掘竞赛
一、数据集介绍该数据集中包含三个文件:LC.csv LP.csv LCIS.csvLC数据集为标的特征表,每只标一条记录。共有21个字段,包括一个主键、7个标本身的信息字段、13个成交时借款人的信息字段。LP数据集为标的还款计划和还款记录表。每只标每期还款一个记录。共有10个字段,包括2个主键,2个还款计划字段和4个还款状态字段。LCIS数据集包含了某一个客户投资的从2015年1月1日起成交的所有
到底了







