使用 StandardScaler() 函数对 Python 数据进行标准化

Mangs

4090人浏览 · 2022-08-17 00:45:34

Mangs · 2022-08-17 00:45:34 发布

各位读者好!在本文中,我们将重点介绍 Python 中最重要的预处理技术之一——使用 StandardScaler() 函数进行标准化。

那么,让我们开始吧!!

需要标准化

在进入标准化之前,让我们首先了解缩放的概念。

缩放特征是使用数据集对算法进行建模的重要步骤。通常用于建模目的的数据是通过各种方式获得的,例如:

问卷
调查
研究
刮擦等

因此,获得的数据包含各种维度和尺度的特征。不同尺度的数据特征会对数据集的建模产生不利影响。

它导致在错误分类错误和准确率方面的预测结果有偏差。因此,有必要在建模之前对数据进行缩放。

这是标准化出现的时候。

标准化是一种缩放技术,它通过将数据的统计分布转换为以下格式来使数据无缩放:

平均值 - 0(零)
标准差 - 1

标准化

这样一来,整个数据集都以零均值和单位方差进行缩放。

现在让我们尝试在接下来的部分中实现标准化的概念。

Python sklearn StandardScaler()函数

Python sklearn 库为我们提供了 StandardScaler() 函数来将数据值标准化为标准格式。

句法:

object = StandardScaler()
object.fit_transform(data)

根据上面的语法,我们初步创建了一个StandardScaler()函数的对象。此外,我们使用fit_transform()以及分配的对象来转换数据并对其进行标准化。

注意:标准化仅适用于遵循正态分布的数据值。

使用 StandardScaler() 函数标准化数据

看看下面的例子!

from sklearn.datasets import load_iris
from sklearn.preprocessing import StandardScaler
 
dataset = load_iris()
object= StandardScaler()
 
# Splitting the independent and dependent variables
i_data = dataset.data
response = dataset.target
 
# standardization 
scale = object.fit_transform(i_data) 
print(scale)

解释:

导入所需的必要库。我们已经导入了 sklearn 库来使用 StandardScaler 函数。
加载数据集。在这里,我们使用了 sklearn.datasets 库中的 IRIS* 数据集。您可以在此处找到数据集。
为 StandardScaler() 函数设置一个对象。
分离自变量和目标变量,如上所示。
使用 fit_transform() 函数将该函数应用于数据集。

输出:

标准化输出

标准化-输出

结论

至此,我们已经结束了这个话题。如果您遇到任何问题,请随时在下面发表评论。

更多与 Python 相关的帖子,请继续关注@Python with JournalDev,直到那时,学习愉快!! :)

Python

Python社区为您提供最前沿的新闻资讯和知识内容

更多推荐

求助！为什么用InsCode部署会出现无限重定向？

Python

如何重塑熊猫。系列

问题:如何重塑熊猫。系列在我看来,它就像 pandas.Series 中的一个错误。 a = pd.Series([1,2,3,4]) b = a.reshape(2,2) b b 有类型 Series 但无法显示,最后一条语句给出异常,非常冗长,最后一行是“TypeError: %d format: a number is required, not numpy.ndarray”。 b.sha

Python

在哪里可以找到有关 Keras 中默认权重初始化器的文档? [复制]

问题:在哪里可以找到有关 Keras 中默认权重初始化器的文档? [复制] 我刚刚在这里](https://keras.io/initializers/)中阅读了有关[中的 Keras 权重初始化器的信息。在文档中,只介绍了不同的初始化程序。如: model.add(Dense(64, kernel_initializer='random_normal')) 当我没有指定kernel_initia