数据处理之归一化
归一化有些情况每个样本的每个特征值具体值并不重要,但是每个样本特征值的占比更加重要.pythonjavaphp20171020820185302019………归一化即是用每个样本的每个特征值除以该样本的各个特征值绝对值总和. 变换后的样本矩阵每个样本的特征值绝对值之和为1.归一化相关API:# norm范数# l1- l1范数向量中每个元素绝对值之和# l2- l2范数向量中每个元素平方之和r =
·
归一化
有些情况每个样本的每个特征值具体值并不重要,但是每个样本特征值的占比更加重要.
python | java | php | |
---|---|---|---|
2017 | 10 | 20 | 8 |
2018 | 5 | 3 | 0 |
2019 | … | … | … |
归一化即是用每个样本的每个特征值除以该样本的各个特征值绝对值总和. 变换后的样本矩阵每个样本的特征值绝对值之和为1.
归一化相关API:
# norm 范数
# l1 - l1范数 向量中每个元素绝对值之和
# l2 - l2范数 向量中每个元素平方之和
r = sp.normalize(array, norm='l1')
案例:
"""
归一化
"""
import numpy as np
import sklearn.preprocessing as sp
samples = np.array([
[17., 100., 4000],
[20., 80., 5000],
[23., 70., 5500]])
r = sp.normalize(samples, norm='l1')
print(r)
[[0.00412922 0.02428953 0.97158125]
[0.00392157 0.01568627 0.98039216]
[0.00411228 0.01251564 0.98337207]]
更多推荐
已为社区贡献5条内容
所有评论(0)