pandas中的isalnum、isdecimal、isdigit、isnumeric、isalpha
最近在忙着把pandas的文档详细过一遍,毕竟提升对“武器”熟练度也是很重要的。正好看到series.str中这些个方法,在处理的时候很容易迷惑,故整理一番文档。
·
最近在忙着把pandas的文档详细过一遍,毕竟提升对“武器”熟练度也是很重要的。正好看到series.str中这些个方法,在处理的时候很容易迷惑,故整理一番文档。
检查字母和数字字符
isalpha
检查字符串是否全为英文(即26个字母的子集)
>>> s1 = pd.Series(['one', 'one1', '1', ''])
>>> s1.str.isalpha()
0 True
1 False
2 False
3 False
isnumeric
检查字符串是否全为数字
>>> s1 = pd.Series(['one', 'one1', '1', ''])
>>> s1.str.isalnum()
0 False
1 False
2 True
3 False
isalnum
检查字符串是否含有字母和数字
>>> s1 = pd.Series(['one', 'one1', '1', ''])
>>> s1.str.isalnum()
0 True
1 True
2 True
3 False
注意,当字符串中混杂了标点符号或空格将不被认为含有字母和数字
>>>
s2 = pd.Series(['A B', '1.5', '3,000'])
>>> s2.str.isalnum()
0 False
1 False
2 False
关于数字检查的更多细节
isdecimal
isdecimal检查以 10 为基数的数字的字符
>>> s3 = pd.Series(['23', '³', '⅕', ''])
>>> s3.str.isdecimal()
0 True
1 False
2 False
3 False
isdigit
isdigit与isdecimal很像,但它还包含了很多特殊的数字,比如上标和下标
>>> s3 = pd.Series(['23', '³', '⅕', ''])
>>> s3.str.isdigit()
0 True
1 True
2 False
3 False
isnumeric
isnumeric与isdigit很像,但它还包含更多表示数量的字符,包含分数
>>> s3 = pd.Series(['23', '³', '⅕', ''])
>>> s3.str.isnumeric()
0 True
1 True
2 True
3 False
更多推荐
已为社区贡献1条内容
所有评论(0)