最近在做一次数据转移(postgresql转移到mysql)的时候,发现会出现如下错误:

 java.sql.SQLException: Incorrect string value: '\xF0\x9F\x92\x94' for column 'name' at row 1  

这是字符集不支持的异常。
新旧数据库都使用的是utf8编码,utf8最大的一个特点,就是它是一种变长的编码方式,它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。其中Emoji表情和一些生僻字是4个字节,而MySql的utf8编码最多3个字节,所以导致了数据插不进去报错。
解决办法是将数据库的编码从utf8修改为utf8mb4.

解决方法(mysql支持的最低版本为5.5.3)

1.docker启动的mysql服务

docker启动的服务就很简单,只需要在run的时候在后面加入参数:–character-set-server=utf8mb4 –collation-server=utf8mb4_unicode_ci ,就可以让docker里面的默认字符变成utf8mb4。

2.正常的mysql服务

1)版本检查

mysql -v

2).更改配置文件

修改mysql的配置文件/etc/mysql/my.cnf, 添加如下内容:

[client]
default-character-set=utf8mb4

[mysql]
default-character-set=utf8mb4

[mysqld]
character-set-client-handshake=FALSE
character-set-server=utf8mb4
collation-server=utf8mb4_unicode_ci
init_connect='SET NAMES utf8mb4'

3)重启数据库

service mysql restart

4)检查编码格式

1.进入msyql

mysql -uroot -p

2.执行查看编码命令

SHOW VARIABLES WHERE Variable_name LIKE 'character_set_%' OR Variable_name LIKE 'collation%';

5)java程序中的连接数据库url中characterEncoding可以去掉,因为数据传输不用规定编码了。

建议:我们数据存储的大量数据不可避免的出现了表情以及生僻字等特殊字符,使用utf-8以及不能解决眼前的问题,所以强烈推荐mysql之后的编码都是用utf8mb4

Logo

权威|前沿|技术|干货|国内首个API全生命周期开发者社区

更多推荐