Base64加密后字符长度变化

问题:文字中包含了emoji表情,公司数据库版本较老,utf-8无法存储emoji这种四个字节的字符。所以解决方案是将文字转换成base64后存入。mysql要对字段长度进行限制,需要知道原文本长度与base64加密后文本长度的比例。

所谓Base64,就是说选出64个字符----小写字母a-z、大写字母A-Z、数字0-9、符号"+"、"/"作为基本基础集的编码方式。

base64加密原理:

①将每三个字节作为一组,一共是24个二进制位。
②将这24个二进制位分为四小组,每个小组有6个二进制位。
③在每小组前面加两个00,扩展成32个二进制位,即四个字节。
④根据base64基础表,得到扩展后的每个字节的对应的base64符号。

UTF-8编码下的中/日/韩文占了3/4个字节
占四个字节是最长的情况:1 : 8
1个中文字符 --》 4个字节 --》 每三个字节分为一组,则分成两组,共6个字节 --》 扩展,得到8个字节 --》 将8个字节转换成8个base64字符。

毕竟四个字节占少数,三个字节情况下是:1 : 4
1个中文字符 --》 3个字节 --》 每三个字节分为一组,则分成一组,共3个字节 --》 扩展,得到4个字节 --》 将4个字节转换成4个base64字符。

所以加密后的字符长度为原长度的4~8倍。这边暂时取值4.5倍

Logo

更多推荐