在Python中使用print输出时，出现UnicodeEncodeError错误，错误提示为“‘gbk‘ codec can‘t encode character ‘\u2022‘ in posit

python 输出打印时报错： print(data_results) UnicodeEncodeError: 'gbk' codec can't encode character '\u2022' in position 82: illegal multibyte sequence

文章共1,262字 · 阅读需要大约5分钟

一键AI生成摘要，助你高效阅读

问答

zengyunda

8299人浏览 · 2023-03-28 09:37:34

zengyunda · 2023-03-28 09:37:34 发布

利用chatgpt一步步解决了这个问题，感觉ChatGPT还是太强大了。

问题描述：

在Python中使用print输出时，出现UnicodeEncodeError错误，错误提示为“'gbk' codec can't encode character '\u2022' in position 82: illegal multibyte sequence”。

解决办法：

1.指定编码格式：在代码开头添加以下注释，指定编码格式为utf-8：

# -*- coding: utf-8 -*-

# -*- coding: utf-8 -*-

2.在输出时指定编码格式：使用encode方法将字符串转换为字节序列，并指定编码格式为utf-8，例如：

print(data_results.encode('utf-8'))

或者使用ignore参数忽略无法处理的字符，例如：

print(data_results.encode('gbk', 'ignore'))

3.将字节序列转换为字符串：使用decode方法将字节序列转换为字符串，例如：

print(data_results.encode('utf-8').decode('utf-8'))

4.在输出时指定编码格式为gbk：如果仍然出现UnicodeEncodeError错误，可以将输出的字符串转换为gbk编码格式，并忽略无法处理的字符，例如：

print(data_results.encode('utf-8').decode('utf-8').encode('gbk', 'ignore').decode('gbk'))

总结：

在Python中输出时，需要注意使用的编码格式，如果出现UnicodeEncodeError错误，可以尝试指定编码格式、忽略无法处理的字符、将字节序列转换为字符串等方法来解决。

提问过程参考。

Q：python 输出打印时报错： print(data_results) UnicodeEncodeError: 'gbk' codec can't encode character '\u2022' in position 82: illegal multibyte sequence

A: 这个错误是由于在输出时，使用的编码格式（gbk）无法处理某些特殊字符（如\u2022），导致出现了非法的多字节序列。可以尝试更改输出的编码格式，例如使用utf-8编码格式：

print(data_results.encode('utf-8'))

或者在代码开头添加以下注释，指定编码格式：

-- coding: utf-8 --

Q：已在代码开头添加以下注释，指定编码格式，但是依然报错

A：如果已经在代码开头指定了编码格式，但是依然报错，可能是因为输出时使用了其他的编码格式。可以尝试在输出时指定编码格式，例如使用utf-8编码格式：

print(data_results.encode('utf-8'))

或者在输出时忽略无法处理的字符：

print(data_results.encode('gbk', 'ignore'))

这样会忽略掉无法处理的字符，但是可能会导致输出结果不完整。

Q：使用了print(data_results.encode('utf-8'))，输出的数据变成了这样“ b'\xe2\x80\xa2 \xe7\x86\x9f\xe7\xbb\x83\xe8\xbd\xaf\xe4\xbb\xb6\xe6\xb5\x8b\xe8\xaf\x95\xe5\x9f\xba\xe7\xa1\x80\xe7\x90\x86\xe8\xae\xba\xef\xbc\x8c\xe6\xb5\x8b\xe8\xaf\x95\xe9\x9c\x80\xe6\xb1\x82\xe5\x88\x86\xe6\x9e\x90\xe5\x92\x8c\xe5\xa4\x9a\xe7\xa7\x8d\xe6\xb5\x8b\xe8\xaf\x95\xe7\x94\xa8\xe4\xbe\x8b\xe8\xae\xbe\xe8\xae\xa1\xe6\x96\xb9\xe6\xb3\x95\n\xe2\x80\xa2 \xe7\x86\x9f\xe6\x82\x89\xe4\xbd\xbf\xe7\x94\xa8\xe6\xb5\x8b\xe8\xaf\x95\xe7\xae\xa1\xe7\x90\x86\xe5\xb7\xa5\xe5\x85\xb7\xef\xbc\x8c\xe5\xa6\x82\xe7\xa6\x85\xe9\x81\x93\xe3\x80\x81Jira\n\xe2\x80\xa2 \xe7\x86\x9f\xe6\x82\x89”

A：这是因为使用了encode('utf-8')方法将字符串转换为了字节序列，所以输出的结果前面有一个'b'表示字节序列。如果想要输出字符串而不是字节序列，可以使用decode('utf-8')方法将字节序列转换回字符串：

print(data_results.encode('utf-8').decode('utf-8'))

这样输出的结果就是字符串而不是字节序列了。

使用了print(data_results.encode('utf-8').decode('utf-8'))，代码报错如下：UnicodeEncodeError: 'gbk' codec can't encode character '\u2022' in position 82: illegal multibyte sequence

这个错误可能是因为在输出时使用的编码格式仍然是gbk，无法处理某些特殊字符（如\u2022）。可以尝试在输出时指定编码格式为utf-8，例如：

print(data_results.encode('utf-8').decode('utf-8').encode('gbk', 'ignore').decode('gbk'))

这样先将字符串转换为字节序列，然后再将字节序列转换为gbk编码的字符串，并忽略无法处理的字符。最后再将字符串输出即可。

Q：非常感谢，问题终于解决了

A：不客气，如果还有其他问题，欢迎随时提问。

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

【目标检测】目标检测的一些常用神经网络模型及方法

我的阶段性总结????文章目录1.概述1.2 目标检测的任务1.3 目标检测的分类2.R-CNN系列2.1 [R-CNN（Region with CNN features）](https://arxiv.org/pdf/1311.2524.pdf)2.2 [Fast R-CNN](https://www.cv-foundation.org/openaccess/content_iccv_2015/