回答问题

TLDR: is-comparison 适用于 Pythonbool,不适用于 numpybool_。是否存在其他差异?


几天前我遇到了布尔值的奇怪行为。当我尝试对这个 numpy 数组使用 is-comparison 时:

arr1 = np.array([1,0,2,0], dtype=bool)
arr1

Out[...]: array([ True, False,  True, False])

(这些变量名是虚构的,与真实变量名或生产代码的任何相似之处纯属巧合)

我看到了这个结果:

arr1 is True

Out[...]: False

这是合乎逻辑的,因为arr1不是 True 或 False,它是 numpy 数组。我检查了这个:

arr1 == True

Out[...]: array([ True, False,  True, False])

这按预期工作。我提到了这个可爱的行为并立即忘记了它。第二天我检查了数组元素的真实性:

[elem is False for elem in arr1]

它还给我这个!

Out[...]: [False, False, False, False]

我真的很困惑,因为我记得在 Python 数组中(我认为问题出在数组行为中):

arr2 = [True, False, True, False]
[elem is False for elem in arr2]

有用:

Out[...]: [False, True, False, True]

此外,它在我的另一个 numpy 数组中工作:

very_cunning_arr = np.array([1, False, 2, False, []])
[elem is False for elem in very_cunning_arr]

Out[...]: [False, True, False, True, False]

当我深入我的数组时,我发现very_cunning_arr是由numpy.object构造的,因为它包含几个非数字元素,所以它包含 Python 布尔值,而arr1是由numpy.bool_构造的。所以我检查了他们的行为:

numpy_waka = np.bool_(True)
numpy_waka

Out[...]: True

python_waka = True
python_waka

Out[...]: True

[numpy_waka is True, python_waka is True]

我终于发现了不同之处:

Out[...]: [False, True]

在所有这些之后,我有两个问题:

1.numpy.bool_bool在它们的共同行为上是否还有一些不同之处? (我知道numpy.bool_有很多numpy函数和参数,比如.T等)

  1. 如何检查 numpy 数组是否仅包含 numpy 布尔值,而不包含 Pythonic 布尔值?

(PS:是的,现在我知道将is与 True/False 进行比较是不好的):

不要使用 u003du003d 将布尔值与 True 或 False 进行比较。

是:如果问候:

否:如果问候 u003du003d True:

更糟:如果问候语为真:

编辑 1: 正如另一个问题中提到的,numpy 有自己的bool_类型。但是这个问题的细节有点不同:我发现 is-statements 的工作方式不同,但在这种差异之前 - 在常见的bool_bool行为中是否还有其他不同之处?如果是,具体是什么?

Answers

In [119]: np.array([1,0,2,0],dtype=bool)                                             
Out[119]: array([ True, False,  True, False])

In [120]: np.array([1, False, 2, False, []])                                         
Out[120]: array([1, False, 2, False, list([])], dtype=object)

注意数据类型。使用 object dtype,数组的元素是 Python 对象,就像它们在源列表中一样。

在第一种情况下,数组 dtype 是布尔值。这些元素表示布尔值,但它们本身不是 PythonTrue/False对象。严格来说Out[119]没有contain``np.bool_对象。Out[119][1]bool_类型,但这是“拆箱”的结果。当您请求一个元素时,这是ndarray索引产生的。 (这种“拆箱”区别适用于所有非对象数据类型。)

通常我们不创建dtype对象,更喜欢np.array(True),而是按照您的示例:

In [124]: np.bool_(True)                                                             
Out[124]: True
In [125]: type(np.bool_(True))                                                       
Out[125]: numpy.bool_
In [126]: np.bool_(True) is True                                                     
Out[126]: False
In [127]: type(True)                                                                 
Out[127]: bool

is是一个严格的测试,不只是为了平等,还有身份。不同类的对象不满足is测试。对象可以满足==测试而不满足is测试。

让我们玩一下 object dtype 数组:

In [129]: np.array([1, False, 2, np.bool_(False), []])                               
Out[129]: array([1, False, 2, False, list([])], dtype=object)
In [130]: [i is False for i in _]                                                    
Out[130]: [False, True, False, False, False]

Out[129]显示中,两个False对象显示相同,但Out[130]测试显示它们不同。


专注于您的问题。

  • np.bool_(False)是一个独特的对象,但与False不同。正如您所注意到的,它具有许多与np.array(False)相同的属性/方法。

  • 如果数组 dtype 是bool它不包含 Pythonbool对象。它甚至不包含np.bool_对象。然而,索引这样的数组将产生bool_。然后将item()应用到它上面会产生一个 Pythonbool

  • 如果数组对象 dtype,它很可能将包含 Pythonbool,除非您采取了特殊步骤来包含bool_对象。

Logo

学AI,认准AI Studio!GPU算力,限时免费领,邀请好友解锁更多惊喜福利 >>>

更多推荐