最近在忙着把pandas的文档详细过一遍,毕竟提升对“武器”熟练度也是很重要的。正好看到series.str中这些个方法,在处理的时候很容易迷惑,故整理一番文档。

检查字母和数字字符

isalpha

检查字符串是否全为英文(即26个字母的子集)

>>> s1 = pd.Series(['one', 'one1', '1', ''])
>>> s1.str.isalpha()
0     True
1    False
2    False
3    False

isnumeric

检查字符串是否全为数字

>>> s1 = pd.Series(['one', 'one1', '1', ''])
>>> s1.str.isalnum()
0    False
1    False
2     True
3    False

isalnum

检查字符串是否含有字母和数字

>>> s1 = pd.Series(['one', 'one1', '1', ''])
>>> s1.str.isalnum()
0     True
1     True
2     True
3    False

注意,当字符串中混杂了标点符号或空格将不被认为含有字母和数字

>>> 
s2 = pd.Series(['A B', '1.5', '3,000'])
>>> s2.str.isalnum()
0    False
1    False
2    False

关于数字检查的更多细节

isdecimal

isdecimal检查以 10 为基数的数字的字符

>>> s3 = pd.Series(['23', '³', '⅕', ''])
>>> s3.str.isdecimal()
0     True
1    False
2    False
3    False

isdigit

isdigit与isdecimal很像,但它还包含了很多特殊的数字,比如上标和下标

>>> s3 = pd.Series(['23', '³', '⅕', ''])
>>> s3.str.isdigit()
0     True
1     True
2    False
3    False

isnumeric

isnumeric与isdigit很像,但它还包含更多表示数量的字符,包含分数

>>> s3 = pd.Series(['23', '³', '⅕', ''])
>>> s3.str.isnumeric()
0     True
1     True
2     True
3    False
Logo

瓜分20万奖金 获得内推名额 丰厚实物奖励 易参与易上手

更多推荐