💎一站式轻松地调用各大LLM模型接口,支持GPT4、智谱、豆包、星火、月之暗面及文生图、文生视频 广告
## 概述 所有的码表必须兼容ASCII码表. 1. ASCII码表,美国发明的.保存了数字,字母,以及一些符号对应成数字.每一个字符都是一个字节.ascii码表没有负数.开头是0是正数,开头是1是负数. 2. GB2312码表,中国发明的,保存常用的汉字(6000-7000个,没有生僻字).一个中文本占两个字节,而且这两个字节都是负数.比如 : "中" 1111 1010 1010 1101 .开头都是1. 3. GBK码表:保存了基本的所有的汉字(一共2w多个). 不管是中文 ,英文,符号都是两个字节.而且这两个字节,第一个是负数,第二个可能是正数,也可能是负数. 4. unicode :统一码表(万国码表).不管是什么语言,都是2个字节. A-65: 0000 0000 0100 0001 ,浪费了很多空间. 5. utf-8:在unicode 的基础上进行了优化.一个字节可以存储的数据,坚决不用两个字节存储.这个码表更加标准化,在每一个字节头加入了编码信息.在utf-8中中文是3个字节. 6. ISO-8859-1:拉丁码表. ## 编码和解码 把具体文字编成对应的数字码值就是编码,把数字码值翻译成具体的文字,就是解码.