归一化

有些情况每个样本的每个特征值具体值并不重要,但是每个样本特征值的占比更加重要.

pythonjavaphp
201710208
2018530
2019

归一化即是用每个样本的每个特征值除以该样本的各个特征值绝对值总和. 变换后的样本矩阵每个样本的特征值绝对值之和为1.

归一化相关API:

# norm  范数
# l1  - l1范数   向量中每个元素绝对值之和
# l2  - l2范数   向量中每个元素平方之和
r = sp.normalize(array, norm='l1')

案例:

"""
归一化
"""
import numpy as np
import sklearn.preprocessing as sp

samples = np.array([
		[17., 100., 4000],
		[20., 80.,  5000],
		[23., 70.,  5500]])

r = sp.normalize(samples, norm='l1')
print(r)
[[0.00412922 0.02428953 0.97158125]
 [0.00392157 0.01568627 0.98039216]
 [0.00411228 0.01251564 0.98337207]]
Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐