# 读取UTF8-BOM多出字符
* * * * *
--: 作者:Fuzz
时间:2018年8月31日
* * * * *
### BOM头是什么
BOM头是放在UTF-8编码的文件的头部的,占用三个字节,用来标识该文件属于UTF-8编码。现在已经有很多软件识别BOM头,但是还有些不能识别BOM头,比如PHP就不能识别BOM头,这也是用记事本编辑UTF-8编码后执行就会出错的原因了。
### 对应的二进制与Unicode
#### Unicode字符
Unicode字符("\uFEFF")
#### 二进制
FE FF UTF16BE
FF FE UTF16LE
EF BB BF UTF8
### 出现原因
如果用windows自带的文本编辑器编辑过文件,就会自动添加上BOM头。
### 解决办法
读取文件时候去除 \uFEFF 内容