UTF-8 BOM
UTF-8 BOM又叫UTF-8 签名,UTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。当文本程序读取到以 EFBBBF开头的字节流时,就知道这是UTF-8编码了。Windows就是使用BOM来标记文本文件的编码方式的。
在解析TSV文件,需要读取到第一列header信息时,需要注意文件格式,会影响到读取的内容。
UTF-8 BOM
UTF-8 BOM又叫UTF-8 签名,UTF-8不需要BOM来表明字节顺序,但可以用BOM来表明编码方式。当文本程序读取到以 EFBBBF开头的字节流时,就知道这是UTF-8编码了。Windows就是使用BOM来标记文本文件的编码方式的。
在解析TSV文件,需要读取到第一列header信息时,需要注意文件格式,会影响到读取的内容。