UnicodeDecodeError: 'ascii' codec can't decode byte 0xe6 in position 0: ordinal not in range(128)

在linux系统下，我们使用python2进行中文字符转码时会经常遇到下述错误UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)示例演示fatpuffer@ubuntu:~$ pythonPython 2.7.15rc1 (default,...

FatPuffer

1645人浏览 · 2019-04-11 20:58:43

FatPuffer · 2019-04-11 20:58:43 发布

在linux系统下，我们使用python2进行中文字符转码时会经常遇到下述错误

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe6 in position 0: ordinal not in range(128)

示例演示

fatpuffer@ubuntu:~$ python
Python 2.7.15rc1 (default, Nov 12 2018, 14:31:15) 
[GCC 7.3.0] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> s = "我用python"
>>> s.encode("utf8")
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe6 in position 0: ordinal not in range(128)

原因分析

（1）首先当我们对中文字符进行utf8编码时，必须保证该中文字符对象是unicode编码格式，我们查询一下linux下python2默认编码格式。

>>> import sys
>>> sys.getdefaultencoding()
'ascii'

（2）我们发现linux下python2默认编码是ascii编码格式，所以报错，此时我们需要手动将其转换为unicode编码，然后再将其转换为utf8编码格式。

>>> s = "我用python"
>>> s.decode("utf-8").encode("utf-8")
'\xe6\x88\x91\xe7\x94\xa8python'

（3）在python2中我们通常在中文字符前加u，使其成为unicode编码，方便我们转码

>>> s = u"我用python"
>>> s.encode('utf-8')
'\xe6\x88\x91\xe7\x94\xa8python'

CSDN学习社区

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

用 OpenAI Assistants 做大模型应用开发

CSDN学习社区

1 小时解读鸿蒙 10 大热点问题

CSDN学习社区

1 小时解读鸿蒙 10 大热点问题

CSDN学习社区

所有评论(0)

查看更多评论

FatPuffer

@qq_42517220

已为社区贡献3条内容