python之字符编码

发布时间 2023-12-04 15:16:39作者: 认真的六六

【字符编码的发展史】

一家独大:ASCII(识别英文字符)-------------诸侯割据(ASCII/GBK/Shift_JIS)---------------一统天下(存在所有语言中的所有字符与数字的一一对应关系,即兼容万国字符,unicode

 

字母对应ASCII表
A-Z:65-90
a-z:97-122
0-9:48-57
小写字母对应的数字一定大于大写字母

 

【编码和解码】

1.编码:由字符转换成内存中的unicode,以及由unicode转换成其他编码的过程,都称为编码encode

2.解码:由内存中的unicode转换成字符,以及由其他编码转换成unicode的过程,都称为解码decode

【UTF-8的诞生】

如果我们输入的字符中包含多国字符,那么该如何处理:

多国字符—√—>内存(unicode格式的二进制)——√—>硬盘(utf-8格式的二进制)