MySQL 设定、修改字符集
一、创建表设定字符集和排序集create table HOURLY_ACTIVITIES_COUNT(idint auto_increment comment 'ID' primary key,user_idvarchar(36) not null comment 'User ID',......) DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_uni
·
一、建表-设定字符集和排序集
create table 表名
(
id int auto_increment comment 'ID' primary key,
user_id varchar(36) not null comment 'User ID',
...
...
) DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci`;
【推荐】建表必须创建默认字符集(Character set)和排序集(Collate)!!!
【推荐】建议指定utf8mb4!扩展性、兼容性极佳。
附录中有MySQL 支持的所有的字符集。
关于排序集,
utf8mb4_unicode_ci
和utf8mb4_general_ci
比较:
准确性:
- utf8mb4_unicode_ci是基于标准的Unicode来排序和比较,能够在各种语言之间精确排序
- utf8mb4_general_ci没有实现Unicode排序规则,在遇到某些特殊语言或者字符集,排序结果可能不一致。
- 但是,在绝大多数情况下,这些特殊字符的顺序并不需要那么精确。
性能:
- utf8mb4_general_ci在比较和排序的时候更快
- utf8mb4_unicode_ci在特殊情况下,Unicode排序规则为了能够处理特殊字符的情况,实现了略微复杂的排序算法。
- 但是在绝大多数情况下发,不会发生此类复杂比较。相比选择哪一种collation,使用者更应该关心字符集与排序规则在db里需要统一。
二、查看数据库、表、字段的字符集
数据库:
# 查看数据库
show variables like '%character%';
show variables like 'collation%';
表:
查看某数据库中所有表的信息:
show table status from 数据库名;
查看数据库中某个表:
show table status from 数据库名 like '%表名%';
列:
查看某个表中所有字段的信息:
show full columns from 表名;
查看表中某个字段的信息:
show full columns from 表名 like '%字段名%';
三、修改数据库,表,字段的字符集
动动脑子好好想想你为什么费这么大劲来修改?是你前人挖的坑?还是你创建的时候没创建好???
动动脑子好好想想你为什么费这么大劲来修改?是你前人挖的坑?还是你创建的时候没创建好???
动动脑子好好想想你为什么费这么大劲来修改?是你前人挖的坑?还是你创建的时候没创建好???
数据库:
修改整个数据库的数据集和排序集:
ALTER DATABASE 数据库名 DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
表:
修改表的默认字符集,以及将表中所有字符列[1]转换为新的字符集
ALTER TABLE 表名 CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
[1] 字符列指的是
CHAR
、VARCHAR
、TEXT
。
仅仅修改表的默认字符集:
ALTER TABLE 表名 DEFAULT CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
列:
修改某一列的字符集和排序集:
ALTER TABLE 表名 CHANGE 列名1 列名2 CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci;
【附录】MySQL 支持的字符集
以MySQL 5.7.34 为例:
show character set;
Charset | Description | Default Collation | Maxlen |
---|---|---|---|
big5 | Big5 Traditional Chinese | big5_chinese_ci | 2 |
dec8 | DEC West European | dec8_swedish_ci | 1 |
cp850 | DOS West European | cp850_general_ci | 1 |
hp8 | HP West European | hp8_english_ci | 1 |
koi8r | KOI8-R Relcom Russian | koi8r_general_ci | 1 |
latin1 | cp1252 West European | latin1_swedish_ci | 1 |
latin2 | ISO 8859-2 Central European | latin2_general_ci | 1 |
swe7 | 7bit Swedish | swe7_swedish_ci | 1 |
ascii | US ASCII | ascii_general_ci | 1 |
ujis | EUC-JP Japanese | ujis_japanese_ci | 3 |
sjis | Shift-JIS Japanese | sjis_japanese_ci | 2 |
hebrew | ISO 8859-8 Hebrew | hebrew_general_ci | 1 |
tis620 | TIS620 Thai | tis620_thai_ci | 1 |
euckr | EUC-KR Korean | euckr_korean_ci | 2 |
koi8u | KOI8-U Ukrainian | koi8u_general_ci | 1 |
gb2312 | GB2312 Simplified Chinese | gb2312_chinese_ci | 2 |
greek | ISO 8859-7 Greek | greek_general_ci | 1 |
cp1250 | Windows Central European | cp1250_general_ci | 1 |
gbk | GBK Simplified Chinese | gbk_chinese_ci | 2 |
latin5 | ISO 8859-9 Turkish | latin5_turkish_ci | 1 |
armscii8 | ARMSCII-8 Armenian | armscii8_general_ci | 1 |
utf8 | UTF-8 Unicode | utf8_general_ci | 3 |
ucs2 | UCS-2 Unicode | ucs2_general_ci | 2 |
cp866 | DOS Russian | cp866_general_ci | 1 |
keybcs2 | DOS Kamenicky Czech-Slovak | keybcs2_general_ci | 1 |
macce | Mac Central European | macce_general_ci | 1 |
macroman | Mac West European | macroman_general_ci | 1 |
cp852 | DOS Central European | cp852_general_ci | 1 |
latin7 | ISO 8859-13 Baltic | latin7_general_ci | 1 |
utf8mb4 | UTF-8 Unicode | utf8mb4_general_ci | 4 |
cp1251 | Windows Cyrillic | cp1251_general_ci | 1 |
utf16 | UTF-16 Unicode | utf16_general_ci | 4 |
utf16le | UTF-16LE Unicode | utf16le_general_ci | 4 |
cp1256 | Windows Arabic | cp1256_general_ci | 1 |
cp1257 | Windows Baltic | cp1257_general_ci | 1 |
utf32 | UTF-32 Unicode | utf32_general_ci | 4 |
binary | Binary pseudo charset | binary | 1 |
geostd8 | GEOSTD8 Georgian | geostd8_general_ci | 1 |
cp932 | SJIS for Windows Japanese | cp932_japanese_ci | 2 |
eucjpms | UJIS for Windows Japanese | eucjpms_japanese_ci | 3 |
gb18030 | China National Standard GB18030 | gb18030_chinese_ci | 4 |
更多推荐
已为社区贡献1条内容
所有评论(0)