admin 管理员组

文章数量: 1086019


2024年1月26日发(作者:iterator继承了collection接口)

字的计算机处理带来很大的困难。要在计算机中处理汉字,必须首先将汉字代码化,即对汉字进行编码。

在汉字字信息处理系统中,存在输入码、交换码、内部码、字形码四种编码。

(1)输入码

为了利用现有的标准西文键来输入汉字,必须为汉字设计输入码。目前,已申请专利的汉字输入编码方案有六七百种之多,而且还不断有新的输入方法问世,以至于有“万马奔腾”之势。按照不同的设计思想,可以把这些数量众多的输入码归纳为四大类:数字编码、拼音码、字形码和音形码。其中,目前应用最广泛的是拼音码和字形码。

(2)交换码

交换码用于汉字外码和内部码的交换。我国于是1981年颁布的《信息交换用汉字符集训`基本集》(代号为GB2312-80)是交换码的国家标准,所以交换码也称为国标码。国标码是双字节代码,即用两个字节作为一个汉字编码。每个字节的最高位为“0”。国标GB2312-80收入常用汉字6763个(其中一级汉字3755个,二能汉字3008个),其他字母及图形符号682个,总计7445个字符。

(3)内部码

内部码是汉字在计算机内的基本表示形式,是计算机对汉字进行识别、存储、处理和传输所用的编码。内部码也是双字节编码,两个字节的最高位都是“1”。计算机信息处理系统就是根据字符编码的最高位是“1”还是“0”来区分字符和ASCII码字符。

(4)字形码

字形码是表示汉字字型信息的编码,用来实现计算机对汉字的输出。由于汉字上方块字,因此字形码最常用的表示方式是点阵式,有16*16点阵、24*24点阵、48*48点阵等等。例如,16*16点阵的含义为:用256(16*16=256)个点来表示一个汉字的字形信息。每个点的“亮”或“灭”两种状态,用一个二进制位的“1”或“0”来表示。因此,存储一个16*16点阵的汉字需要256位,共8位字节。

采用何种点阵,取决于汉字输入质量的要求。点阵的点数越多,输出的汉字就越精确、美观。

存储何种汉字的字形点阵要占用大量的存储空间,通过将其以字库的形式放在计算机的外存中。需要时才检索字库,输入相应汉字的字形。

1.3 计算机系统

1.3.1 计算机系统的组成

完整的计算机系统包括硬件系统和软件系统两大部分。硬件是指物理设备,软件是指程序及开发、使用和维护程序所需的各种文档。人们平时说的“计算机”一般都是指含有硬件和软件的计算机系统。计算机系统的组成如图1-1所示。

计算机系统

计算机系统

CPU

计算机硬件系统

计算机软件系统


本文标签: 计算机 点阵 交换 编码 计算机系统