如何在matplotlib中创建密度图?

Mangs

44人浏览 · 2022-08-20 11:32:37

Mangs · 2022-08-20 11:32:37 发布

回答问题

在 R 中,我可以通过执行以下操作创建所需的输出:

data = c(rep(1.5, 7), rep(2.5, 2), rep(3.5, 8),
         rep(4.5, 3), rep(5.5, 1), rep(6.5, 8))
plot(density(data, bw=0.5))

R 中的密度图

在python(使用matplotlib)中,我得到的最接近的是一个简单的直方图:

import matplotlib.pyplot as plt
data = [1.5]*7 + [2.5]*2 + [3.5]*8 + [4.5]*3 + [5.5]*1 + [6.5]*8
plt.hist(data, bins=6)
plt.show()

matplotlib 中的直方图

我还尝试了normedu003dTrue 参数但除了尝试将高斯拟合到直方图之外什么也得不到。

我最近的尝试是在scipy.stats和gaussian_kde附近,遵循网上的例子,但到目前为止我还没有成功。

Answers

Sven 已经展示了如何使用 Scipy 中的gaussian_kde类,但是您会注意到它看起来与您使用 R 生成的不太一样。这是因为gaussian_kde尝试自动推断带宽。您可以通过更改gaussian_kde类的函数covariance_factor以某种方式使用带宽。首先,这是您在不更改该功能的情况下得到的结果:

替代文字

但是,如果我使用以下代码:

import matplotlib.pyplot as plt
import numpy as np
from scipy.stats import gaussian_kde
data = [1.5]*7 + [2.5]*2 + [3.5]*8 + [4.5]*3 + [5.5]*1 + [6.5]*8
density = gaussian_kde(data)
xs = np.linspace(0,8,200)
density.covariance_factor = lambda : .25
density._compute_covariance()
plt.plot(xs,density(xs))
plt.show()

我明白了

替代文字

这与您从 R 中得到的非常接近。我做了什么?gaussian_kde使用可变函数covariance_factor来计算其带宽。在更改函数之前,covariance_factor 针对该数据返回的值约为 0.5。降低它会降低带宽。更改该函数后,我必须调用_compute_covariance以便正确计算所有因素。它与 R 中的 bw 参数并不完全对应,但希望它可以帮助您朝着正确的方向前进。

Python

Python社区为您提供最前沿的新闻资讯和知识内容

更多推荐

求助！为什么用InsCode部署会出现无限重定向？

Python

如何重塑熊猫。系列

问题:如何重塑熊猫。系列在我看来,它就像 pandas.Series 中的一个错误。 a = pd.Series([1,2,3,4]) b = a.reshape(2,2) b b 有类型 Series 但无法显示,最后一条语句给出异常,非常冗长,最后一行是“TypeError: %d format: a number is required, not numpy.ndarray”。 b.sha

Python

在哪里可以找到有关 Keras 中默认权重初始化器的文档? [复制]

问题:在哪里可以找到有关 Keras 中默认权重初始化器的文档? [复制] 我刚刚在这里](https://keras.io/initializers/)中阅读了有关[中的 Keras 权重初始化器的信息。在文档中,只介绍了不同的初始化程序。如: model.add(Dense(64, kernel_initializer='random_normal')) 当我没有指定kernel_initia