特征降维之低方差特征过滤
特征降维之低方差特征过滤API分析删除低方差的一些特征,前面讲过方差的意义。再结合方差的大小来考虑这个方式的角度。特征方差小:某个特征大多样本的值比较相近特征方差大:某个特征很多样本的值都有差别APIsklearn.feature_selection.VarianceThreshold(threshold =0.0)。删除所有低方差特征Variance.fit_transform(X)X:nump
·
删除低方差的一些特征,前面讲过方差的意义。再结合方差的大小来考虑这个方式的角度。
- 特征方差小:某个特征大多样本的值比较相近
- 特征方差大:某个特征很多样本的值都有差别
API
sklearn.feature_selection.VarianceThreshold(threshold =0.0)
。- 删除所有低方差特征
Variance.fit_transform(X)
X:numpy array
格式的数据[n_samples,n_features]
- 返回值:训练集差异低于
threshold
的特征将被删除。默认值是保留所有非零方差特征,即删除所有样本中具有相同值的特征。
分析
1、初始化VarianceThreshfold
,指定阀值方差
2、调用fit_transform
from sklearn.feature_selection import VarianceThreshold
if __name__ == '__main__':
data = [
[1, 2, 3, 4, 5],
[1, 7, 8, 9, 10],
[1, 12, 13, 14, 15]
]
# 示例化一个转化器类
transfer = VarianceThreshold() # `threshold` 用默认值 0
# 调用 transfer.fit_transform
data_final = transfer.fit_transform(data)
print('返回结果为:', data_final)
'''
返回结果为: [[ 2 3 4 5]
[ 7 8 9 10]
[12 13 14 15]]
'''
更多推荐
已为社区贡献6条内容
所有评论(0)