C#学习笔记之编码

发布时间 2023-11-14 16:47:36作者: ycx-x

归纳:

一、ASCII码

ASCII码是用来表示英文字符的一种编规范,每个ASCII字符占用1个字节,因此,ASCII编码可以表示的最大字符数为255(00H-FFH)。 

二、Unicode码

Unicode也是一种字符编码方法,它占用两个字节(0000H-FFFFH),容纳65536个字符。

三、UTF-8

以8位为单元对Unicode进行编码,从Unicode到UTF-8的编码方式如下:

例如:“汉”字的Unicode编码是6C49。6C49在0800-FFFF之间,所以要用3字节模板:1110xxxx 10xxxxxx 10xxxxxx。将6C49写成二进制是:0110 110001 001001,用这个比特流依次代替模板中的x,得到:11100110 10110001 10001001,即E6 B1 89。

四、实例

1、 Encoding.ASCII与字符串

2、Encoding.Unicode与字符串

3、Encoding.BigEndianUnicode与字符串

4、Default与字符串

5、Encoding.UFT32与字符串

6、Encoding.UFT7与字符串

7、Encoding.UFT8与字符串

8、Encoding.ASCII与中文

9、Encoding.Unicode与中文

10、Encoding.UTF-32与中文

11、Encoding.UTF-7与中文

12、Encoding.UTF-8与中文