上QQ阅读APP看书,第一时间看更新
2.1.2 文本数据与二进制数据的区别
文本数据的最小单位是字符,每个字符实际上是以数字形式来表示的(字符与数字的对应关系即为编码)。文本数据本质上还是二进制数据,两者的区别在于处理方式不同。
应用程序处理文本数据时,会以字符为单位,一个字符可能占用1个字节、两个字节或多个字节,而二进制数据是以字节为单位进行处理的。
以下面的4个字节数据为例。
如果认为它是GB2312编码的文本数据,那么它就是“春天”这两个字。前两个字节对应“春”字,后两个字节对应“天”字。如果认为它是二进制数据,那么它就仅仅是4个字节的数据而已。
如何处理一段数据,取决于应用程序本身。如用记事本打开或保存文件时,是以字符为单位的,如果用它打开图像文件,则只能看到乱码,而用图片浏览器打开文本文件也不能正常显示。