为什么要编码
你看到的中文,英文,韩文,只是视觉概念,计算机只认1和0 的高低电位
编码的历史
1.ASCII编码
最古老的标准,老美的标准(HTTP/1.1)其中的header就是使用此编码
映射的数量极少,占用空间少2.中文的
GB2312 GBK GB18030-2000 通通可以忽略都是历史产物。3.国际化标准
UTF-8 Unicode 组织定义的涵盖全球所有字符集的编码库
英文使用8位(即一个字节),中文使用24为(三个字节)来编码。4.转换
各类编码的转换都需要UTF-8进行中转
字符集
Unicode是字符集,描述所有语言和0101的映射关系。
utf8是对Unicode字符集的编码方式,就是能压缩一些存储空间,比如对于英文文本和ASCII编码一样,中文占用3个字符。
utf8mb4 主要是扩展utf-8的4位存储(表情),但是会导致部分表索引过长