数据处理之归一化
归一化有些情况每个样本的每个特征值具体值并不重要,但是每个样本特征值的占比更加重要.pythonjavaphp20171020820185302019………归一化即是用每个样本的每个特征值除以该样本的各个特征值绝对值总和. 变换后的样本矩阵每个样本的特征值绝对值之和为1.归一化相关API:# norm范数# l1- l1范数向量中每个元素绝对值之和# l2- l2范数向量中每个元素平方之和r =
·
归一化
有些情况每个样本的每个特征值具体值并不重要,但是每个样本特征值的占比更加重要.
python | java | php | |
---|---|---|---|
2017 | 10 | 20 | 8 |
2018 | 5 | 3 | 0 |
2019 | … | … | … |
归一化即是用每个样本的每个特征值除以该样本的各个特征值绝对值总和. 变换后的样本矩阵每个样本的特征值绝对值之和为1.
归一化相关API:
# norm 范数
# l1 - l1范数 向量中每个元素绝对值之和
# l2 - l2范数 向量中每个元素平方之和
r = sp.normalize(array, norm='l1')
案例:
"""
归一化
"""
import numpy as np
import sklearn.preprocessing as sp
samples = np.array([
[17., 100., 4000],
[20., 80., 5000],
[23., 70., 5500]])
r = sp.normalize(samples, norm='l1')
print(r)
[[0.00412922 0.02428953 0.97158125]
[0.00392157 0.01568627 0.98039216]
[0.00411228 0.01251564 0.98337207]]
更多推荐
7日热学榜
活动日历
查看更多
活动时间 2025-01-01 00:00:00

丁奇:MySQL高频面试题详解
活动时间 2025-01-01 00:00:00

AI 大模型应用开发 · 实战营
活动时间 2025-01-01 00:00:00

AI系列课程-IT全学科自学科
活动时间 2025-01-01 00:00:00

3 小时掌握 Prompt 核心技巧与 GPT 技术理论
活动时间 2025-01-01 00:00:00

0基础2个月拿下软考高级证书体验课
所有评论(0)