使用整数的 Numpy 点积非常慢

问题:使用整数的 Numpy 点积非常慢抱歉这么多问题。我在 Intel core 2 Duo 上运行 Mac OSX 10.6。我正在为我的研究运行一些基准测试,但我遇到了另一件让我困惑的事情。如果我跑 python -mtimeit -s 'import numpy as np; a = np.random.randn(1e3,1e3)' 'np.dot(a,a)' 我得到以下输出:10

Mangs

94人浏览 · 2022-08-25 20:28:15

Mangs · 2022-08-25 20:28:15 发布

问题:使用整数的 Numpy 点积非常慢

抱歉这么多问题。我在 Intel core 2 Duo 上运行 Mac OSX 10.6。我正在为我的研究运行一些基准测试,但我遇到了另一件让我困惑的事情。

如果我跑

python -mtimeit -s 'import numpy as np; a = np.random.randn(1e3,1e3)' 'np.dot(a,a)'

我得到以下输出:10 loops, best of 3: 142 msec per loop

但是,如果我运行

python -mtimeit -s 'import numpy as np; a = np.random.randint(10,size=1e6).reshape(1e3,1e3)' 'np.dot(a,a)'

我得到以下输出:10 loops, best of 3: 7.57 sec per loop

然后我跑了

python -mtimeit -s 'import numpy as np; a = np.random.randn(1e3,1e3)' 'a*a'然后

python -mtimeit -s 'import numpy as np; a = np.random.randint(10,size=1e6).reshape(1e3,1e3)' 'a*a'

两者都以每个循环约 7.6 毫秒的速度运行,因此它不是乘法。添加也有相似的速度,所以这些都不应该影响点积,对吧?那么为什么使用整数计算点积比使用浮点数慢 50 倍以上呢?

解答

非常有趣,我很好奇它是如何实现的,所以我做了:

>>> import inspect
>>> import numpy as np
>>> inspect.getmodule(np.dot)
<module 'numpy.core._dotblas' from '/Library/Python/2.6/site-packages/numpy-1.6.1-py2.6-macosx-10.6-universal.egg/numpy/core/_dotblas.so'>
>>>

所以看起来它使用了BLAS库。

所以:

>>> help(np.core._dotblas)

我从中找到了这个:

当 Numpy 使用 ATLAS 等加速 BLAS 构建时,这些函数将被替换以利用更快的实现。更快的实现只影响 float32、float64、complex64 和 complex128 数组。此外,BLAS API 仅包括矩阵-矩阵、矩阵-向量和向量-向量乘积。具有较大维度的数组的产品使用内置函数并且不加速。

所以看起来 ATLAS 微调了某些功能,但它只适用于某些数据类型,非常有趣。

所以是的,看起来我会更频繁地使用花车......

向您推荐>>百度飞桨AI Studio社区

学AI，认准AI Studio！GPU算力，限时免费领，邀请好友解锁更多惊喜福利 >>>

更多推荐

求助！为什么用InsCode部署会出现无限重定向？

Python

如何重塑熊猫。系列

问题:如何重塑熊猫。系列在我看来,它就像 pandas.Series 中的一个错误。 a = pd.Series([1,2,3,4]) b = a.reshape(2,2) b b 有类型 Series 但无法显示,最后一条语句给出异常,非常冗长,最后一行是“TypeError: %d format: a number is required, not numpy.ndarray”。 b.sha

Python

在哪里可以找到有关 Keras 中默认权重初始化器的文档? [复制]

问题:在哪里可以找到有关 Keras 中默认权重初始化器的文档? [复制] 我刚刚在这里](https://keras.io/initializers/)中阅读了有关[中的 Keras 权重初始化器的信息。在文档中,只介绍了不同的初始化程序。如: model.add(Dense(64, kernel_initializer='random_normal')) 当我没有指定kernel_initia