字符串的解码和编码

发布时间 2023-11-27 22:23:02作者: 坚持坚持再一次坚持
#str表示字符串类型  转为bytes类型(二进制类型)
s='伟大的中国梦'
scode=s.encode(errors='replace') #默认是utf-8,因为utf-8每个中文占3个字节
print(scode) #所以输出18位字节
#输出结果为:\xe4\xbc\x9f\xe5\xa4\xa7\xe7\x9a\x84\xe4\xb8\xad\xe5\x9b\xbd\xe6\xa2\xa6
#用_gbk 方式
scode= s.encode('gbk','replace') #gbk每个中文占字节2个
print(scode)
#输出结果为:\xce\xb0\xb4\xf3\xb5\xc4\xd6\xd0\xb9\xfa\xc3\xce

#编码出现问题/错误的三种方式 1.replace 以问号输出 ? 2.strict中文翻译为严谨的,代码会报错 3.ignore 忽略错误部分

#解码过程:将bytes>>str
print(bytes.decode(scode,encoding='gbk'))
#输出为:伟大的中国梦