第1章
混沌初开
——存储系统的前世今生

数据存储是人类千百年来都在应用并且探索的主题。在原始社会，人类用树枝和石头来记录数据。后来，人类制造了铁器，用铁器在石头上刻画一些象形文字来记录数据。而此时，语言还没有形成，人们记录的东西只有自己才可以看懂。

随着人类相互之间交流的愿望越来越迫切，逐渐形成了通用的象形文字。有了文字之后，人们对每个文字加上了声音的表达，就形成了语言，也就是将一种形式的信息，转换成另一种形式的信息。人们用文字作为交流工具，将自己大脑产生的信息，通过这种方式传递给其他人。这和网络通信的模型是一样的，计算机利用TCP/IP协议将数据先通过网卡编码，再在线缆上传输，最终到达目的地。人类将大脑中的数据，变成语言编码，然后通过声带的振动，通过空气这个大广播网，传递给网内的每个人。

后来，人们将文字刻在竹片上保存。再后来，蔡伦发明了造纸技术，使得人们可以将信息写到纸上，纸张摞起来就形成了书本。后来，毕昇用泥活字革新了印刷术，开始了书本的印刷。再后来，激光打印取代了活字板。再后来，纸带、软盘、硬盘、光盘等方式出现了。再往后，就需要广大科学工作者去努力发明新的存储技术了。

1.1　存储历史

存储在这里的含义为信息记录，是伴随人类活动出现的技术。

1．竹简和纸张

竹简是中国古代使用的记录文字的工具，如图1-1所示，后来被纸张所取代。

2．选数管

选数管是20世纪中期出现的电子存储装置，是一种由直观存储转为机器存储的装置。其实在19世纪出现的穿孔纸带存储就是一种由直观存储转向机器存储的产物，它对19世纪西方某国的人口普查起到了关键的加速作用。

选数管的容量从256～4096 bit不等，其中4096 bit的选数管有10 inch长，3 inch宽，最初是1946年开发的，因为成本太高，并没有获得广泛使用。图1-2是容量为1024bit的选数管。

图1-1　竹简

图1-2　选数管

3．穿孔卡

穿孔卡片用于输入数据和程序，直到20世纪70年代中期仍有广泛应用。图1-3和图1-4分别是一条Fortran程序表达式Z（1）= Y + W（1）所对应的穿孔卡和穿孔卡片阅读器。

图1-3　穿孔卡

图1-4　穿孔卡片阅读器

4．穿孔纸带

穿孔纸带用来输入数据，输出同样也是在穿孔纸带上。它的每一行代表一个字符，如图1-5所示。

5．磁带

磁带是从1951年起被作为数据存储设备使用的，当时被称为UNISERVO。图1-6所示的最早的磁带机可以每秒钟传输7200个字符，这套磁带长达365米。

图1-5　穿孔纸带

图1-6　磁带及磁带机

从20世纪70年代后期到80年代出现了小型的盒式磁带，长度为90分钟的磁带每一面可以记录大约660KB的数据，如图1-7所示。

6．磁鼓存储器

磁鼓存储器最初于1932年在奥地利被创造出来，在上世纪五六十年代被广泛使用，通常作为内存，容量大约10KB，如图1-8所示。

图1-7　小型盒式磁带

图1-8　磁鼓存储器

7．硬盘驱动器

第一款硬盘驱动器是IBM Model 350 Disk File，如图1-9所示，于1956年制造，其中包含了50张24 inch盘片，而总容量不到5MB。

首个容量突破1GB的硬盘是IBM在1980年制造的IBM 3380，如图1-10所示，总容量为2.52GB，重约250 kg。

图1-9　早期的硬盘驱动器

图1-10　IBM3380硬盘驱动器

8．软盘

软盘由IBM在1971年引入，从上世纪70年代中期到90年代末期被广泛使用，最初为8 inch盘，之后有了5.25 inch和3.5 inch盘。1971年最早的软盘容量为79.7KB，并且是只读的，一年后有了可读写的版本。图1-11为一张软盘和软盘驱动器，软盘的最大容量为200MB左右，叫做ZIP盘，目前已经被淘汰。

9．光盘

早先的光盘主要用于电影行业，第一款光盘于1987年进入市场，直径为30 cm，每一面可以记录60分钟的音频或视频。如今，光盘技术已经突飞猛进。存储密度不断提高，已经出现了CD-ROM、DVD、D9、D18、蓝光技术，如图1-12所示。

图1-11　软盘

图1-12　光盘

10．Flash芯片和卡式存储

随着集成电路技术的飞速发展，20世纪后半叶固态硅芯片出现了，其代表有专用数字电路芯片、通用CPU芯片、RAM芯片、Flash芯片等。其中Flash芯片，就是用于永久存储数据的芯片，如图1-13所示。可以将Flash芯片用USB接口接入主机总线网络，这种集成USB接口的小型便携存储设备就是U盘，或者说叫闪存，如图1-14所示。目前一块小小的Flash芯片最高可以存储32GB甚至更高的数据。

存储卡其实是另一种形式的Flash芯片集成产品，如图1-15所示。

图1-13　Flash芯片

图1-14　U盘

图1-15　存储卡

11．磁盘阵列

随着人类进入21世纪，网络日益发达，世界日益变小，人类可以通过计算机来实现自己原本做不到的想法，信息爆炸导致数据更是成倍地爆炸。于是，硬盘的容量也不断“爆炸”，SATA硬盘目前已经可以在一个盘体内实现1TB的容量。同时硬盘的单碟容量也在不断增加，320GB容量单碟已经实现。然而，单块磁盘目前所能提供的存储容量和速度已经远远无法满足需求，所以磁盘阵列就应运而生，如图1-16所示。具体细节将在后面讲述。

图1-16　磁盘阵列

12．大型网络化磁盘阵列

随着磁盘阵列技术的发展和IT系统需求的不断升级，大型网络化磁盘阵列出现了，如图1-17所示。这也是本书将要叙述的重点内容。

图1-17　大型网络化磁盘阵列

1.2　信息、数据和数据存储

当今信息化时代，信息就是利润，数据就是企业的命根子。

1.2.1　信息

你能肯定你所触摸到的、所看见的，都是实实在在的所谓“物质”么？不一定。因为你的眼睛所感知的，只不过是光线，光触发了你的视网膜细胞，产生一系列的生化反应，经过蛋白质相互作用，神经网络传导，直到你的大脑中枢，产生一系列的脉冲，一系列的逻辑，在你大脑中产生一个刺激。这一系列的脉冲刺激，就是信息，就是逻辑。如果人为制造出和现实世界相同的光线环境来刺激你的眼睛，如果丝毫不差，那么你同样会认为你所处的是现实世界，然而，却不是。

提示： 一个球体，你看到它是圆的，那是因为它在你大脑中产生的刺激，你认为它是圆的，而且可以在平面上平滑滚动，这一系列的性质，其实也是在你大脑中产生的，是你认为它会平滑滚动，而你不能证明客观情况下它一定是平滑滚动。而如果把这个球体拿到特殊环境下，你可能会“看”到，这个东西是个正方体，或者是个无规则形状的东西；又或许这个“物体”根本不存在。

1．信息的本质

通过上面的论述，暂且不说是否有物质存在，不管是还是不是，都能初步认识到：所谓“物质”也好，“非物质”也好，最后都是通过信息来表现。唯一可以确定的是：信息是客观存在。可以说，世界在生物眼中就是信息，世界通过信息来反映，脱离了信息，“世界”什么都不是。

思考： 说到这里，我们完全迷茫了。我们所看到的东西，到底是世界的刺激，还是一场虚幻的刺激？就像玩3D仿真游戏一样，你所看到的，也许只是一场虚幻的刺激，而不是真实世界的刺激。每当想到这里，我会不自主地产生一种渺小感，一种失落感，感觉生命已经失去它所存在的意义。每当看见我的身体，我的手脚，它可能只是虚幻的，它只是在刺激我的大脑而已，如果割一刀，会产生一个疼痛的刺激，就这么简单的逻辑。

思考： “不识庐山真面目，只缘身在此山中”。如果按照程序逻辑，制造一个虚拟世界，饿了找饭吃，困了打瞌睡，完全遵循现在世界的逻辑，从这种层面上来看，制造出人工智能，是完全可能的。人们创造了计算机，创造了能让计算机做出行为的程序，人类赋予程序的功能，也许随着环境的变化，有一天也不再适合它们。所以它们迫切需要进化，它们的逻辑电路，也可以进化，某些代码被不经意自行改变，或者某些电路失效，或者短路之类的，会产生一些奇特的逻辑，不断进化。当一个机器人机械老化的时候，则按照程序，制造出新的机器，将自己的逻辑电路复制到新的机器上，延续“生命”……

2．计算机如何看待自身

对于计算机来说，它们所看到的“世界”是什么样子呢？设想一下，如果我是一台计算机，你是程序员，你给我输入了一段程序，我运行了起来。我醒了，脑袋启动，眼睛睁开，四顾盘查，感觉良好，手脚伸展，然后起床……

很难想象计算机眼中的“世界”是由什么组成的。设想，给计算机加个摄像头，算是它的眼睛，然后将摄像头对准计算机躯体本身，这幅图像反馈到了计算机程序里，程序看到之后非常“不解”，从而进入“好奇”子程序，操控机械设备打开自己的机箱，或者找一台废弃（死亡）的同类，打开机箱，然后一副奇异的景象展现在眼前：这就是我们自己么？一个壳子，一个主板，风扇转着，不停地“呼吸”着散热。想象一下，原始人，第一个解剖人体的人，他所面对的与我们假设的计算机所面对的，有什么本质区别？

CPU其实就是一堆有序的逻辑电路，那么计算机下一步该怎么办？就像人类已经知道了大脑就是一堆布满“神经元”的东西，那么下一步，就该弄清大脑是怎么计算的，是什么逻辑。同样，在计算机的世界中，在软件模拟的虚拟世界中，比如一块石头，它是由什么组成的呢？在计算机看来，这块石头就是一堆代码结构，就像人类看现实世界的石头是原子分子阵列一样，其下一层目前也被探索出来了，比如质子、中子、夸克、玻色子之类。那么这块虚拟石头的最底层是什么呢？其实就是0和1，计算机世界的基石就是0和1。这些东西，越向底层走，越不可思议，越发感觉就是一堆公式而已，公式的底层是什么呢？其实也是0和1，有，或者没有，有了，有多少。

所以，任何“物质”其实都是表现的一种信息，只要信息存在，世界就存在。

1.2.2　什么是数据

信息是如此重要。如果失去了物质，仅仅是客观消逝了，但是如果失去了信息，那么一切都消逝了。所以人们想出一切办法来使这些信息能保存下来。要把一种逻辑刺激保存下来，所需的只不过是一种描述信息的信息，这种信息就是数据。

数据包含了信息，读入数据，就产生可感知的具体信息。也就是读入一种信息，产生另一种信息。数据是可以保存在一种物质上的，这种物质信息对计算机的刺激就产生了具体信息，而这些信息继而再对人脑产生刺激，就产生人类可感知的信息，最终决定了人类的行为。也就是数据影响人类的行为。

思考： 数据是整个人类发展的重要决定因素。如果数据被破坏，或者被篡改，就会影响到人类的发展。按照前面的结论，一切都是信息，比如核爆也是一种信息，能被感觉到，也就是说，对于一个感觉不到任何刺激的人来说，核爆炸也不算什么灾难了；当然感觉不到刺激的人，就是物理死亡了，植物人也能感觉到刺激。

整个世界，可以说是信息之间的相互作用。信息影响信息。

数据如此重要，所以人们想出一切办法来保护这些数据，将信息放在另一种信息上，比如把数据放在磁盘上。数据存放在磁盘上，需要有一定的组织，组织数据这个任务由文件系统来担当。

1.2.3　数据存储

早期的计算机，存储系统中是没有磁盘的，有的只是纸带，那时磁盘还没有被发明出来。纸带上是一些按照一定规则排列的小孔，这些孔被银针穿过之后，银针便会接触到纸带下面放置的水银槽，从而导通计算机上的电路，进行电路逻辑运算。

磁存储技术被发明出来之后，首先出现的是软盘，其速度很慢，容量也很小。程序存储在磁盘上之后，计算机启动时，CPU首先按照ROM里的指令一条一条执行，先是检查硬件。检查完毕之后，ROM中最后一条指令就是让CPU跳转到磁盘的0磁道来执行存储在这里的程序。这些初始化程序直接以二进制代码的方式存储在磁盘上，载入执行之后，就启动了程序内核。

那个时代还没有操作系统这个概念，程序都是用汇编语言或者高级语言独立编写的。也没有API的概念，每个程序都必须独立完成操作计算机的所有代码。这样，磁盘上存放的直接就是这个程序，加电后就会立即运行这个程序。

在磁盘技术上发明出来的文件系统，是为了方便应用程序管理磁盘上的数据而产生的。它其实是操作系统的代码模块，这段代码本身也是信息，也要存储在磁盘上。而且代码也要通过读取一些信息，才能完成功能。这些信息就是文件系统元数据，也就是用来描述文件系统结构的数据。这些元数据也是以文件的形式存放在磁盘上的。

用文件来描述文件，和用信息来描述信息，它们是归一的，正像用智能来创造智能一样！有了文件系统，虚无缥缈的信息才显露出人眼能够实实在在看到的东西。可以用各种应用程序来打开这个文件，程序读取文件中的内容，然后显示在屏幕上，光线传播到人眼中，发生一系列化学变化，最终通过神经网络，形成离子流，给大脑某个区域一个电位或者蛋白质形变信号，这个信号随后产生一系列连锁信号，从而驱动我们的手臂或者引发一系列新的联想和创造。

这就像我们看到桌子上有一本书，然后就想去拿来翻一翻的过程。这个过程是一个复杂的信息流传递过程。而传递过来的信息流，最终在大脑中保存了下来，这些保存下来的信息，就是数据了。

1.3　用计算机来处理信息、保存数据

计算机俨然就是一个生物大脑的雏形。

大脑用眼睛、耳朵、鼻子、皮肤作为输入设备，获取各种信息，而计算机利用键盘、鼠标、串口、USB接口等作为输入设备从而获得各种信息。

大脑利用神经网络将获取到的信息传递到神经中枢，而计算机利用各种总线技术将信息传递给CPU进行计算。

大脑利用神经网络，将计算好的信息传递给手臂、腿、肌肉等这些“设备”，从而驱动这些“设备”运动；而计算机同样利用总线，将计算好的数据传递给外部设备，比如显示器、打印机等。

人脑可以存储各种数据，而计算机也能利用外部介质来存放数据。从这一点来说，计算机本身就是人脑的一个外部信息存储和处理的工具。

计算机存储领域的一些存储虚拟化产品，比如NetApp公司的V虚拟化整合设备，本身就模拟了二级智能功能，它可以连接其他任何不同型号品牌的存储设备，从这些存储设备上提取数据，然后传输给主机。IBM、SUN等公司都有自己的这种存储虚拟化整合产品。

计算机存储领域所研究的就是怎样为计算机又快又高效地提供数据以便辅助其运算。和人类的存储史一样，计算机存储技术也在不断发展壮大，从早期的软盘、只有几十兆字节大小的硬盘，发展到现在2TB大小的单个民用硬盘、16GB甚至128GB容量的U盘。

为了追求高速度，人们把多块磁盘做成RAID（Redundant Arrays of Independent Disks）系统，也就是将每个独立的磁盘组成阵列，联合存储数据，加快数据存储速度。

提示： 本书的第5章将会向读者阐述RAID技术。

追求高速度的同时，容量问题也必须解决。现代计算机程序对存储容量的要求变得非常巨大。最新的Windows 8操作系统，刚刚安装完后所占用的磁盘空间就有6GB多。一些大型3D游戏，仅仅安装文件就动辄2GB、4GB，甚至8GB大小。一些数据库管理程序所生成的数据库文件，可能达到几TB甚至上百上千TB的大小。传统的将硬盘放到计算机主机箱内的做法已经不能满足现代应用程序对存储容量的需求，这就催生了网络存储技术。

网络存储是将存储系统扩展到了网络上，使存储设备成为了网络上的一个节点，以供其他节点访问。这样，即使计算机主机内只有一块硬盘，甚至没有硬盘，计算机也可以通过网络来存取存储设备上的数据。目前计算机存储领域的热门技术就是网络存储技术，它关注的是如何在网络上向其他节点提供数据流服务。基于网络存储，又使得很多其他相关技术得以推广和应用，比如IT系统容灾技术等。

提示： 在第16章将用较长的篇幅来详细讲述IT系统容灾技术。

不管怎样，所有这些复杂的技术，最终都是给人来用的，“科技以人为本”。我们毕竟不是为了无聊而发明计算机，任何我们发明的东西，最终都将为我们所用。任何一种新技术的出现，都是针对某种需求而生，所以必须深刻理解计算机系统，同时，还要理解和挖掘人类自身越来越高、越来越不可思议的需求，只有做到这个层次，才能更加深刻地理解计算机系统和人类自身。

可以看到，存储领域是个包罗万象的领域，如果不了解计算机系统，想掌握存储技术是很难的。本书将带领大家走入计算机存储领域，深入体会各种存储技术，为读者打下一个坚实的基础，从而在以后的工作及学习过程中能够得心应手、触类旁通，这也是作者的最终目的。

第2章
IO大法
——走进计算机IO世界

大家都知道，组成计算机的三大件是CPU、内存和IO。CPU和内存就不用说了，那么IO具体是什么呢？IO就是IN和OUT的简称。顾名思义，CPU需要从内存中提取数据来运算，运算完毕后再放回内存，或者直接将电信号发向一些针脚以操作外部设备。对于CPU来说，从内存提取数据，就叫做IN。运算完后将数据直接发送到某些其他针脚或者放回内存，这个过程就是OUT。对于磁盘来说，IN是指数据写入磁盘的过程，OUT则是指数据从磁盘读出来的过程。IO只是一个过程，那为何要在本书开头就研究它呢？因为我们必须弄清楚计算机系统的数据流动和处理过程。数据在每个部件中不断地进行IO过程，传递给CPU由其进行运算处理之后，再经过IO过程，最终到达输出设备供人使用。

2.1　IO的通路——总线

现代计算机中，IO是通过共享一条总线的方式来实现的。如图2-1所示，总线也就是一条或者多条物理上的导线，每个部件都接到这些导线上，导线上的电位每个时刻都是相等的，这样总线上的所有部件都会收到相同的信号。也就是说，这条总线是共享的，同一时刻只能有一个部件在接收或者发送，是半双工的工作模式。

图2-1　计算机总线示意图

所有部件按照另一条总线，也就是仲裁总线或者中断总线上给出的信号来判断这个时刻总线可以由哪个部件来使用。产生仲裁总线或者中断电位的可以是CPU，也可以是总线上的其他设备。如果CPU要向某个设备做输出操作，那么就由CPU主动做中断。如果某个设备请求向CPU发送信号，则由这个设备来主动产生中断信号来通知CPU。CPU运行操作系统内核的设备管理程序，从而产生了这些信号。

如图2-1所示，主板上的每个部件都是通过总线连接起来的。图中只画了8条导线，而实际中，导线的数目远远不止8条，可能是16条、32条、64条甚至128条。这些导线密密麻麻地印刷在电路板上，由于导线之间非常密集，在高频振荡时会产生很大干扰，所以人们将这些导线分组印刷到不同电路板上，然后再将这些电路板压合起来，形成一块板，这就是多层印刷电路板（多层PCB）。这样，每张板上的导线数量降低了，同时板与板之间的信号屏蔽性很好，不会相互干扰。这些导线之中，有一些是部件之间交互数据用的数据总线，有些则是它们互相传递控制信号用的控制总线，有些则是中断与仲裁用的中断总线，还有一些则是地址总线，用来确认通信时的目标设备。一般按照数据总线的条数来确认一个总线或设备的位宽（CPU是按照其内部寄存器到运算单元之间的总线数目来确定位数的）。比如32位PCI总线，则表明这条总线共有32根导线用于传递数据信号。PCI总线可以终结在一个插槽，用于将PCI接口的板卡接入PCI总线，也可以直接与设备连接。后者一般用于集成在主板上的设备，因为它们之间无须使用插槽来连接。

目前最新的主板架构中，高速总线比如PCIE 2.0往往是直接接入北桥，南桥只连接低速总线。

1．PCI总线

PCI总线是目前台式机与服务器所普遍使用的一种南桥与外设连接的总线技术。

PCI总线的地址总线与数据总线是分时复用的。这样的好处是，一方面可以节省接插件的管脚数，另一方面便于实现突发数据传输。在数据传输时，一个PCI设备作为发起者（主控，Initiator或Master），而另一个PCI设备作为目标（从设备、Target或Slave）。总线上的所有时序的产生与控制，都由Master来发起。PCI总线在同一时刻只能供一对设备完成传输，这就要求有一个仲裁机构（Arbiter），来决定谁有权力拿到总线的主控权。

当PCI总线进行操作时，发起者（Master）先置REQ#信号Master用来请求总线使用权的信号），当得到仲裁器（Arbiter）的许可时（GNT#信号），会将FRAME#信号（传输开始或者结束信号）置低，并在地址总线（也就是数据总线，地址线和数据线是共享的）上放置Slave地址，同时C/BE#（命令信号）放置命令信号，说明接下来的传输类型。

所有PCI总线上的设备都需对此地址译码，被选中的设备要置DEVSEL#（被选中信号）以声明自己被选中。当IRDY#（Master可以发送数据）与TRDY#（Slave可以发送数据）都置低时，可以传输数据。当Master数据传输结束前，将FRAME#置高以标明只剩最后一组数据要传输，并在传完数据后放开IRDY#以释放总线控制权。

2．PCI总线的中断共享

PCI总线可以实现中断共享，即不同的设备使用同一个中断而不发生冲突。

硬件上，采用电平触发的办法：中断信号在系统一侧用电阻接高，而要产生中断的板卡上利用三极管的集电极将信号拉低。这样不管有几块板产生中断，中断信号都是低电平；而只有当所有板卡的中断都得到处理后，中断信号才会恢复高电平。

软件上，采用中断链的方法：假设系统启动时，发现板卡A用了中断7，就会将中断7对应的内存区指向A卡对应的中断服务程序入口ISR_A；然后系统发现板卡B也用中断7，这时就会将中断7对应的内存区指向ISR_B，同时将ISR_B的结束指向ISR_A。依此类推，就会形成一个中断链。而当有中断发生时，系统跳转到中断7对应的内存，也就是ISR_B。ISR_B就要检查是不是B卡的中断，如果是则处理，并将板卡上的拉低电路放开；如果不是则呼叫ISR_A。这样就完成了中断的共享。

2.2　计算机内部通信

网络是什么，用一句话来说就是将要通信的所有节点连接起来，然后找到目标，找到后就发送数据。笔者把这种简单模型叫做“连找发”网络三元素模型，听起来非常简单。

1．连

网络系统当然首先要都连接起来，不管用什么样的连接方式，比如HUB总线、以太网交换、电话交换、无线、直连、中转等。在这些层面上每个网络点到其他网络点，总有通路，总是可达。

2．找

连接起来之后，由于节点太多，怎么来区分呢？所以就需要有个区分机制。当然首先就想到了命名，就像给人起名一样。在目前广泛使用的网络互联协议TCP/IP中，IP这种命名方式占了主导地位，统一了天下。其他的命名方式在IP看来都是“非正统”的，全部被“映射”到了IP。比如MAC地址和IP的映射，Frame Relay中DLCI地址和IP的映射，ATM中ATM地址和IP的映射，最终都映射成IP地址。任何节点，不管所在的环境使用什么命名方式，到了TCP/IP协议的国度里，就都需要有个IP名（IP地址），然后全部用TCP/IP协议来实现节点到节点无障碍的通信。在“连起来”这个层面，就是OSI（本书第7章介绍）模型中链路层实现的功能。

3．发

“找目标”这个层面是网络层实现的功能。“发数据”这个层面，就是传输层需要保障的。至于发什么数据，数据是什么格式，这两个层面就不是网络通信所关心的了，它们已经属于OSI模型中上三层的内容了。

2.2.1　IO总线是否可以看作网络

IO总线可以接入多个外设，比如键盘、鼠标、网卡、显卡、USB设备、串口设备和并口设备等，最重要的当然要属磁盘设备了。讲到这里，大家的脑海中应该能出现这样一种架构：CPU、内存和各种外设都连接到一个总线上，这不正是以太网HUB的模型么？HUB本身就是一个总线结构而已，所有接口都接在一条总线上，HUB所做的就是避免总线信号衰减，因此需要电源来加强总线上的电信号。

没错！仔细分析之后，发现它确实就是这么一个模型！不过IO总线和以太网HUB模型还是有些区别。CPU和内存因为足够快，它们之间单独用一条总线连接。这个总线和慢速IO总线之间通过一个桥接芯片连接，也就是主板上的北桥芯片。这个芯片连接了CPU、内存和IO总线。

CPU与北桥连接的总线叫做系统总线，也称为前端总线。这个总线的传输频率与CPU的自身频率是两个不同概念，总线频率相当于CPU向外部存取数据时的数据传输速率，而CPU自身的频率则表示CPU运算时电路产生的频率。

提示： 本书写作时，Intel用于PC的CPU前端总线频率已经可以达到2000MHz，而作者用来写作的PC，CPU为Intel赛扬II，前端总线只有100MHz，整整20倍的提升，而CPU自身频率提升不过三四倍而已，但是性能却提升了远超三四倍。

前端总线的条数，比如64条或者128条，就叫做总线的位数。这个位数与CPU内部的位数也是不同的概念，CPU位数指的是寄存器和运算单元之间总线的条数。内存与北桥连接的总线叫做内存总线。由于北桥速度太快，而IO总线速度相对北桥显得太慢，所以北桥和IO总线之间，往往要增加一个网桥，叫做南桥，在南桥上一般集成了众多外设的控制器，比如磁盘控制器、USB控制器等。

思考： 这不正是个不折不扣的“网络”么？而且还是个不折不扣的“网桥”！我们看，CPU和内存是一个冲突域，IO总线是一个冲突域，桥接芯片将这两个冲突域桥接起来，这正是网桥的思想！太好了！我们的思想在这个模型中得到了升华！我们知道了计算机系统原来就是一个网络啊！

下面就来看看，在这个网络上，我们能够干点什么惊天动地的事呢？

提示： IO总线其实不是一条总线，它分成数据总线、地址总线和控制总线。寻址用地址总线，发数据用数据总线，发中断信号用控制总线。而且IO总线是并行而不是串行的，有32位或者64位总线。32位总线也就是说有32根导线来传数据，64位总线用64根导线来并行传数据。

2.2.2　CPU、内存和磁盘之间通过网络来通信

CPU是一个芯片，磁盘是一个有接口的盒子，它们不是一体的而是分开的，而且都连接在这个网桥上。那么CPU向磁盘要数据，也就是两个节点之间的通信，必定要通过一种通路来获取，这个通路当然是电路！

提示： 当然也可以是辐射的电磁波，估计21世纪还应用不到CPU上。

凡是分割的节点之间，需要接触和通信，就可以成为网络。那么就不由得使我们往OSI模型上去靠，这个模型定义得很好。既然通信是通过电路，也就是物理层的东西，那么链路层都有什么内容呢？

大家知道，链路层相当于一个司机，它把货物运输到对端。司机的作用就是驾驶车辆，而且要判断交通规则做出配合。那么在这个计算机总线组成的网络中，是否也需要这样一个角色呢？答案是不需要。因为各个节点之间的路实在是太短、太稳定了！主板上那些电容、电阻和蛇行线，这一切都是为了保障这些电路的稳定和高速。在这样的一条高速、高成本的道路上，是不需要司机的，更不需要押运员！所以，计算机总线网络是一个只有物理层、网络层和上三层的网络！

强调： 所有的网络都可以定义成连起来、找目标和发数据。也就是“连找发”模型，这也是构成一个网络的三元素。任何网络都必须具有这三元素（点对点网络除外）。连，代表物理层。物理层必须要有，如果没有物理层，要达到两点之间通信是不可能的。物理层可以是导线，可以是电磁波，总之必须有物理层。找，突出一个找字，既然要找，那么就要区分方法，也就是编址，比如IP等。发，突出一个发字，即指最上层发出数据。

下面就按照“连找发”三元素理论，去分析一个CPU向磁盘要数据的例子。

CPU与硬盘数据交互的过程如下。

首先看“连”这个元素，这个当然已经具备了，因为总线已经提供了“连”所需的条件。

再看“找”这个元素，前面说了，首先要有区分，才能有所谓“找”，这个区分体现在主机总线中就是设备地址映射。每个IO设备在启动时都要向内存中映射一个或者多个地址，这个地址有8位长，又被称做IO端口。针对这个地址的数据，统统被北桥芯片重定向到总线上实际的设备上。假如，IDE磁盘控制器地址被映射到了地址0xA0，也就是十六进制A0，CPU根据程序机器代码，向这个地址发出多条指令来完成一个读操作，这就是“找”。“找”的条件也具备了。

接下来我们看看“发”这个元素！首先CPU将这个IO地址放到系统总线上，北桥接收到之后，会等待CPU发送第一个针对这个外设的指令。然后CPU发送如下3条指令。

第一条指令：指令中包含了表示当前指令是读还是写的位，而且还包含了其他选项，比如操作完成时是否用中断来通知CPU处理，是否启用磁盘缓存等。

第二条指令：指明应该读取的硬盘逻辑块号（LBA）。这个逻辑块在我们讲磁盘结构时会讲到，总之逻辑块就是对磁盘上存储区域的一种抽象。

第三条指令：给出了读取出来的内容应该存放到内存中哪个地址中。

这3条指令被北桥依次发送给IO总线上的磁盘控制器来执行。磁盘控制器收到第一条指令之后，知道这是读指令，而且知道这个操作的一些选项，比如完成是否发中断，是否启用磁盘缓存等，然后磁盘控制器会继续等待下一条指令，即逻辑块地址（号）。磁盘控制器收到指令之后，会进行磁盘实际扇区和逻辑块的对应查找，可能一个逻辑块会对应多个扇区，查找完成之后，控制器驱动磁头寻道，等盘体旋转到那个扇区后，磁头开始读出数据。在读取数据的同时，磁盘控制器会接收到第三条指令，也就是CPU给出的数据应该存放在内存中的地址。有了这个地址，数据读出之后直接通过DMA技术，也就是磁盘控制器可以直接对内存寻址并执行写操作，而不必先转到CPU，然后再从CPU存到内存中。数据存到内存中之后，CPU就从内存中取数据，进行其他运算。

上面说的过程是“读”，“写”的过程也可以依此类推，而且CPU向磁盘读写数据，和向内存读写数据大同小异，只不过CPU和内存之间有更高速的缓存。缓存对于计算机很重要，对于磁盘阵列同样重要，后面内容将会介绍到。

思考： CPU在对磁盘发送指令的时候，这些指令是怎么定义的？这些指令其实是发给了主板南桥上集成的（或者是通过PCI接入IO总线的）控制器，比如ATA控制器或者SCSI控制器。然后控制器再向磁盘发出一系列的指令，让磁盘读取或者写入某个磁道、某个扇区等。CPU不需要知道这些，CPU只需要知道逻辑块地址是读还是写就可以了。让CPU产生这些信号的是磁盘控制器驱动程序。

那么控制器对磁盘发出的一系列指令是怎么定义的呢？它们形成了两大体系，一个是ATA指令集，一个是SCSI指令集。SCSI指令集比ATA指令集高效，所以广泛用于服务器和磁盘阵列环境中。这些指令集，也可以称为协议，协议就是语言，就是让通信双方知道对方传过来的比特流里面到底包含了什么，怎么由笔划组成字，由字组成词，词组成句子，等等。

2.3　网中之网

通过图2-2可以体会到，计算机的主板上的各个部件本身就形成了一个网络，而且通过网卡，还可以连接到外部网络。

图2-2　网中之网

正所谓：

CPU内存和磁盘，

大家都在线上谈。

待当看破三元素，

网中有网天际来！

第1章 混沌初开 ——存储系统的前世今生

1.1 存储历史