上QQ阅读APP看书,第一时间看更新
3.3 字符信息的编码与表示
计算机处理的数据分为数值型和非数值型两类。数值型数据指数学中的代数值,具有量的含义,且有正负、整数和小数之分;而非数值型数据是指输入到计算机中的所有信息,没有量的含义,如数字符号0~9、大写字母A~Z或小写字母a~z、汉字、图形、声音及其他一切可印刷的符号+、-、!、#、%、>>等。由于计算机采用二进制,所以输入到计算机中的任何数值型和非数值型数据都必须转换为二进制。
在非数值型数据中有这样一种类型,即字符型数据,它包括字母、文字、符号、数字等,由于计算机内部所有的信息都是以二进制形式存储的,所以必须按照某种规则对字符数据进行处理。对于任意一个计算机可以识别的字符数据,都按照特定编码规则使其与一个二进制编码建立一一对应的关系,也就是说在这种编码规则下,用一个二进制编码表示一个字符数据。对应不同种类字符有不同的编码规则,如对应于英文字母、符号等字符有ASCII码、BCD码,对应于中文字符有GB 2312等各种不同的编码规则,而且这些编码规则一般是国家标准或国际标准,是被国家或国际上所承认并执行的。