购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2 信息的表示与存储

考点1数据与信息

(1)概述

①数据

数据是对客观事物的符号表示,它有数值、文字、语言、图形、图像等不同形式。

②信息

a.信息既是对各种事物变化和特征的反映,又是事物之间相互作用、相互联系的表征。它是一种知识,是接收者原来不了解的知识。

b.信息通常以数据的形式出现,如数值、文字、语言、图形、图像等。

c.信息不仅维系着社会的生存和发展,而且在不断地推动着社会和经济的发展。

(2)关系

①联系:数据是信息的载体。

②区别:信息有意义,而数据没有。数据处理之后产生的结果为信息,信息具有针对性、时效性。

考点2计算机中的数据

(1)计算机的内部

计算机内部均用二进制来表示各种信息。

①ENIAC是一台十进制的计算机;冯·诺依曼在研制IAS时,提出了二进制的表示方法,从此改变了整个计算机的发展历史。

②二进制只有“0”和“1”两个数码。它的特点是:运算简单、易于物理实现、通用性强,所占用的空间和所消耗的能量小得多,机器可靠性高。

(2)计算机与外部的交往

它采用十进制数据、文字显示以及图形描述等。

(3)计算机内外部转换

转换由计算机系统的硬件和软件来实现。转换过程如图1-3所示。

图1-3 各类数据在计算机中的转换过程

考点3计算机中数据的单位

(1)概述

计算机中数据的最小单位是位。存储容量的基本单位是字节。8个二进制位称为1个字节,此外还有KB、MB、GB、TB等。

(2)分类

①位(bit)

a.位是度量数据的最小单位。

b.在数字电路和计算机技术中采用二进制表示数据,代码只有0和1。采用多个数码(0和1的组合)来表示一个数,其中的每一个数码称为1位。

②字节(Byte)

a.字节是信息组织和存储的基本单位,也是计算机体系结构的基本单位。

b.一个字节由8位二进制数字组成(1 Byte=8 bit)。

c.为了便于衡量存储器的大小,统一以字节(Byte,B)为单位。

千字节1 KB=1024 B=2 10 B

兆字节1 MB=1024 KB=2 20 B

吉字节1 GB=1024 MB=2 30 B

太字节1 TB=1024 GB=2 40 B

③字长

a.人们将计算机一次能够并行处理的二进制位称为该机器的字长,称为计算机的一个“字”。

b.计算机的字长通常是字节的整倍数,如8位、16位、32位,发展到今天微型机的64位,大型机已达128位。

c.字长是计算机的一个重要指标,直接反映一台计算机的计算能力和计算精度。字长越长,计算机的数据处理速度越快。

考点4 进位计数制及其转换

(1)进位计数制(数制)

①进位计数制是指多位数码中每一位的构成方法以及从低位到高位的进位规则。

②如果采用R个基本符号表示数值,则称R数制,R称该数制的基数(Radix),而数制中固定的基本符号称为“数码”。处于不同位置的数码代表的值不同,与它所在位置的“权”值有关。任意一个R进制数D均可展开为:

其中R为计数的基数;ki为第i位的系数,可以为0,1,2,„,R-1中的任何一个;R i 称为第i位的权。

③计算机中常用的几种进位计数制:

a.相关表示如表1-2所示。

表1-2 计算机中常用的几种进位计数制的表示

其中,十六进制的数字符号A,B,C,D,E,F,它们分别等于十进制的10,11,12,13,14,15。

b.十进制数0~15与等值二进制、八进制、十六进制数的对照表

第一,相关对照表如表1-3所示。

表1-3 不同进制数的对照表

第二,采用不同的数制表示同一个数时,基数越大,则使用的位数越少。

第三,在程序的书写中,一般采用八进制或十六进制表示数据。

第四,在数制中有一个规则,就是Ⅳ进制一定遵循“逢Ⅳ进一”的进位规则,如十进制就是“逢十进一”,二进制就是“逢二进一”。

(2)R进制转换为十进制

①将R进制数按权展开求和即可得到相应的十进制数,这就实现了R进制对十进制的转换。

例如:

②部分二进制的权值如表1-4所示。

表1-4 部分二进制的权值

(3)十进制转换为R进制

①将十进制数转换为R进制数时,可将此数分成整数与小数两部分分别进行转换,然后再拼接起来即可。

②一个十进制数D可以写成如下形式:

a.若将(D)——10除以2,则得到商为,余数为k0二进制数的最低位(最低有效位)。再将商写成如下形式:

若将式(1.2)再除以2,则得到余数为k1——二进制数的次低位。

b.将整数部分除以2,得到的余数为二进制数的最低位;每次将得到的商除以2,得到二进制数的其余各位。当商为0时,得到余数kn-1——二进制数的最高有效位(MSB)。

③方法:

a.“除R取余”法:将十进制整数连续地除以R取余数,直到商为0,余数从右到左排列,首次取得的余数排在最右边。采用:将一个十进制整数转换成R进制数可以采用。

b.“乘R取整”法:将十进制小数不断乘以R取整数,直到小数部分为0或达到要求的精度为止;所得的整数从小数点之后自左往右排列,取有效精度,首次取得的整数排在最左边。采用:将小数部分转换成R进制数可以采用。

(4)八进制转换为十六进制

①八进制和十六进制的优点:八进制和十六进制数比等值的二进制数的长度短得多,而且它们之间转换也非常方便。因此在书写程序和数据用到二进制数的地方,往往采用八进制数或十六进制数的形式。

②二进制、八进制和十六进制之间存在特殊的关系,即1位八进制数相当于3位二进制数,1位十六进制数相当于4位二进制数。

③八进制数与二进制数、十六进制数之间的关系:

a.相关关系如表1-5所示。

表1-5 八进制数与二进制数、十六进制数之间的关系

b.根据这种对应关系,二进制数转换成八进制数时,以小数点为中心向左右两边分组,每3位为一组,两头不足3位补0即可。同样,二进制数转换成十六进制数只需要每4位为一组进行分组分别进行转换即可。

例如:将二进制数(10101011.110101)B转换成八进制数:

同样,将八(十六)进制数转换成二进制数,只要将1位转换为3(4)位即可。例如:

注意:整数前的高位0和小数后的低位0可以不写,例如:

可以写为:

【真题演练】

1.十进制数59转换成无符号二进制整数是( )。[2015年3月真题]

A.0111101

B.0111011

C.0111101

D.0111111

2.已知a=00101010B和b=40D,下列关系式成立的是( )。[2014年3月真题]

A.a>b

B.a=b

C.a<<span >b

D.不能比较

考点5字符的编码

(1)概述

①字符包括西文字符(字母、数字、各种符号)和中文字符,即所有不可做算术运算的数据。

②字符必须按特定的规则进行二进制编码才能进入计算机。字符形式的多少涉及编码的位数。

③字符编码的方法。

a.确定需要编码的字符总数;

b.将每一个字符按顺序确定序号,序号的大小无意义,仅作为识别与使用这些字符的依据。

(2)分类

①西文字符的编码

a.字符编码是指用以表示字符的二进制编码。

b.计算机中最常用的字符编码是ASCII。ASCII码有7位码和8位码两种版本,国际通用的是7位ASCII码,用7位二进制数表示一个字符的编码,共有2 7 =128个不同的编码值,相应可以表示128个不同字符的编码。

c.7位ASCII码表如表1-6所示。

表1-6 7位ASCII码表

第一,表1-6中对大小写英文字母、阿拉伯数字、标点符号及控制符等特殊符号规定了编码,表中每个字符都对应一个数值,称为该字符的ASCII码值。其排列次序为b6b5b4b3b2b1b0,b6为最高位,b0为最低位。

第二,从ASCII码表中看出,有34个非图形字符(控制字符),94个可打印字符(图形字符)。在这些字符中,从小到大的排列有0~9、A~Z、a~z,且小写字母比大写字母的码值大32。

有些特殊的字符编码是容易记忆的,例如:

“a”字符的编码为1100001,对应的十进制数是97,则“b”的编码值是98。

“A”字符的编码为1000001,对应的十进制数是65,则“B”的编码值是66。

“0”数字字符的编码值为0110000,对应的十进制数是48,则“1”的编码值是49。

第三,计算机的内部用一个字节(8个二进制位)存放一个7位ASCII码,最高位为0。

②汉字的编码

a.GB码或国标码

第一,它把最常用的6763个汉字分成两级:一级汉字有3755个,按汉语拼音字母的次序排列;二级汉字有3008个,按偏旁部首排列。

第二,一个国标码用两个字节来表示一个汉字,每个字节的最高位为0。

b.区位码

第一,GB 2312-80中的6763个汉字分为94行、94列,代码表分94个区(行)和94个位(列)。由区号(行号)和位号(列号)构成了区位码。区位码由4位十进制数字组成,前两位为区号,后两位为位号。

第二,区位码最多可以表示94×94=8836个汉字。

第三,在区位码中,01~09区为特殊字符,10~55区为一级汉字,56~87区为二级汉字。

c.区位码与国标码间的转换

将一个汉字的十进制区号和十进制位号分别转换成十六进制;然后再分别加上20H(十进制就是32),就成为汉字的国标码。

例如:汉字“中”字的区位码与国标码及转换如下:

区位码5448D (3630)H

国标码8680D (3630H+2020H)=5650H

二进制表示为:(00110110 00110000)B+(00100000 00100000)B=(01010110 01010000)B

③汉字的处理过程

从汉字编码的角度看,计算机对汉字信息的处理过程实际上是各种汉字编码间的转换过程。

a.汉字编码的内容

主要包括:汉字输入码、汉字内码、汉字地址码、汉字字形码等。其编码及流程如图1-4所示。

图1-4 汉字信息处理系统的模型

从图中可以看到:不论哪一种汉字输入方法,计算机都将每个汉字的汉字输入码转换为相应的国标码,然后再转换为机内码,进行计算机内存储和处理。

b.汉字输入码(外码)

第一,汉字输入码是指为将汉字输入计算机而编制的代码。

第二,一个好的输入编码应是:编码短,重码少,好学好记,便于学习和掌握。

第三,目前常用的输入法类别有:音码、形码、语音输入、手写输入或扫描输入等。不同的输入法有不同的输入码。

第四,区位码作为输入法,其最大优点是一字一码的无重码输入,最大的缺点是代码难以记忆。

c.汉字内码

第一,汉字内码是为在计算机内部对汉字进行存储、处理的汉字编码。

第二,汉字内码的形式多种多样。目前,对应于国标码,一个汉字的内码用2个字节存储,并把每个字节的最高二进制位置“1”作为汉字内码的标识。如果用十六进制来表述,就是把汉字国标码的每个字节上加一个(80)H(即二进制数10000000)。

第三,汉字的国标码与其内码存在下列关系:

汉字的内码=汉字的国标码+(8080)H

例如,在前面已知“中”字的国标码为(5650)H,则根据上述关系式得:

“中”字的内码=“中”字的国标码为(5650)H+(8080)H=(D6D0)H

二进制表示为:(01010110 01010000)B+(10000000 10000000)B

=(11010110 11010000)B

第四,西文字符的内码是7位ASCII码,一个字节的最高位为0。每个西文字符的ASCII码值均小于128。汉字用两个字节来存储,区位码再分别加上20H,就成为汉字的国标码。

第五,为了区分是汉字还是ASCII码,将国标码每个字节的最高位由0变为1,变换后的国标码称为汉字内码。

④汉字字形码(汉字字模)

汉字字形码用于汉字在显示屏或打印机输出。汉字字形有两种表示方式:

a.点阵表示方式

第一,点阵表示方式的汉字字形码指的是这个汉字字形点阵的代码。

第二,根据输出汉字的要求不同,点阵的类型有:简易型汉字(16×16点阵,如图1-5所示);普通型汉字(24×24点阵);提高型汉字(32×32点阵、48×48点阵)等等。

图1-5 汉字字形点阵机器编码

第三,一般对应不同的字体有不同的字库,字库中存储了每个汉字的点阵代码。字模点阵只能用来构成“字库”。输出汉字时,先根据汉字内码从字库中提取汉字的字形数据,然后根据字形数据显示和打印出汉字。

第四,点阵规模愈大,字形愈清晰美观,所占存储空间也愈大。但其表示方式的缺点是字形放大后失真。

b.矢量表示方式

第一,矢量表示方式存储的是描述汉字字形的轮廓特征。当要输出汉字时,通过计算机的计算,由汉字字形描述生成所需大小和形状的汉字点阵。

第二,矢量化字形描述与最终文字显示的大小、分辨率无关。

第三,Windows中使用的TrueType技术就是汉字的矢量表示方式,它解决了汉字点阵字形放大后出现锯齿现象的问题。

⑤汉字地址码

a.汉字地址码是指汉字库(这里主要指整字形的点阵式字模库)中存储汉字字形信息的逻辑地址码。需要向输出设备输出汉字时,必须通过地址码对汉字库进行访问。

b.汉字库中,字形信息都是按一定顺序连续存放在存储介质中,汉字地址码也大多连续有序,与汉字内码间有着简单的对应关系。

⑥其他汉字内码

a.GBK码(扩充汉字内码规范)

第一,它是我国制定的,对多达2万多的简、繁汉字进行了编码,是GB 2312-80码的扩充。

第二,它以2字节表示一个汉字,第一个字节为(81)H~(FE)H,第二个字节为(40)H~(FE)H。第二个字节的最左边不一定是1。

第三,使用:简体版中文Windows 95/98/2000/XP。

b.UCS码(通用多八位编码字符集)

第一,它是国际标准化组织(ISO)为各种语言字符制定的编码标准。

第二,ISO/IEC10646字符集中的每个字符用4个字节(组号、平面号、行号和字位号)唯一地表示,第一个平面(00组中的00平面)称为基本多文种平面(BMP),包含字母文字、音节文字以及中、日、韩(CJK)的表意文字等。

c.Unicode编码

第一,它是另一个国际编码标准,是能用双字节编码统一地表示几乎世界上所有书写语言的字符编码标准。

第二,它可容纳65536个字符编码,主要用来解决多语言的计算问题。

第三,应用:网络、Windows系统和很多大型软件。

d.BIG5码

第一,它是目前中国台湾、香港地区普遍使用的一种繁体汉字的编码标准。

第二,使用:中文繁体版Windows 95/98/2000/XP。

【真题演练】

1.在标准ASCII码表中,已知英文字母A的十进制码值是65,英文字母a的十进制码值是( )。[2015年3月真题]

A.95

B.96

C.97

D.91

2.下列4个4位十进制数中,属于正确的汉字区位码的是( )。[2014年3月真题]

A.5601

B.9596

C.9678

D.8799

3.存储1024个24×24点阵的汉字字形码需要的字节数是( )。[2014年9月真题]

A.720B

B.72KB

C.7000B

D.7200B XesOV8Wgqjst7LhRhTxJgJkPeqqh+BtQMvAhunjyERr6x0mJXK53M2i/gkfC3bYY

点击中间区域
呼出菜单
上一章
目录
下一章
×