《信息简史》是美国著名科学作家詹姆斯·格雷克的一部精彩著作。作者从人类处理信息的历史中撷取了几个重要节点,将人类处理信息的历史大致划分为两个阶段,即历史和超历史阶段。历史阶段经历的时间很长,大约有数千年,而超历史阶段则刚刚开始。在历史阶段,人类有信息与计算技术,但更重要的还是利用传统的生产资料生存;而在超历史阶段,信息则成为第一位的资源,其地位远超出传统的生产资料。
这本书的精彩之处在于,它集中讨论了历史阶段向超历史阶段转换的部分,也就是说,从 1948 年香农的信息论和晶体管的问世后半个多世纪内所发生的变化。作者对香农的信息论的解读非常到位,将香农的《通信的数学理论》这篇专业文献的精髓用比较通俗的语言,介绍给了有一定科学素养的读者。信息论彻底改变了人们的世界观,这就是所谓的“信息转向”。转向让人们认识到,信息是物理的,即“万物源于比特”。作者的这种思想贯穿了全书。
该书的另一特色就是趣味性。作为科学传播的著作,不仅要有很精到的专业知识,而且要引起读者的兴趣,使之从阅读中获得快乐和营养,从中得到专业知识之外或围绕专业知识的轶事趣闻以及在科技研究中的苦辣酸甜。作者在这方面下了很大工夫,查阅了大量的非专业文献和相关传记,此非一般科学作家所能比拟。该书在美国甫一问世,就受到市场的追捧,成为畅销书。仅两年时间,它获得的荣誉和奖项就达十多项。
作为科学传播的著作,仅有专业性和趣味性还不够,文采也不可或缺。而格雷克在这方面可以说驾轻就熟,文笔老道。此前他已经出版过《混沌》、《费曼传》、《越来越快》和《牛顿传》,都是受到读者欢迎的书籍。从2003年以来,作者便集中精力于《信息简史》的写作,很少有作家能花如此长的时间于一本书上。所以它的成功不是偶然的,而是格雷克上下求索的激情所致。书后的参考文献共涉及560种著作,足见其用心良苦。
刘钢
中国社会科学院哲学所研究员
在信息“碎片化”时代,这是一本值得收藏并反复阅读的书。生动的语言,哲学式的思考,超群的洞察力,为我们描绘信息史。而这个历史正在开始它最壮丽的时代:大数据时代。“万物源自比特”,大数据如同波涛汹涌的海洋,在这个数据大航海时代,我们会扮演什么角色?有何作为?
——田溯宁(宽带资本董事长,亚信创始人)
《信息简史》让我联想到《时间简史》,但这次我是能看懂其中的大部分内容了。与霍金一样,詹姆斯·格雷克选取了一个宏大的主题,大概很少有人敢这样去想吧。但他敢想敢做,并且在我看来,做得还相当不错。
——俞敏洪(新东方董事长)
这似乎是本无所不包的书,其中既有我们熟悉的文字、词典、电话、电报,也有我们不熟悉的,如非洲会说话的鼓、麦克斯韦妖、随机性、量子比特等。但这正表明信息无处不在,各个领域都可以从信息和信息论的视角重新加以认识。我个人最感兴趣的是第3章“两本词典”(第一本英语词典以及著名的《牛津英语词典》)。相信各位读者也能从中找到自己感兴趣的章节,获取有益的信息。
——徐小平(真格基金创始人,新东方联合创始人)
香农的信息论的意义怎么评价都不过分。无论是大数据、移动互联网等新趋势,还是我们日常使用的网络、电脑、电话、手机等,其中的很多原理都可以追溯到1948年香农的那篇开创性论文。但香农的地位往往为主流科学史所低估,更不为普通公众所了解。詹姆斯·格雷克的《信息简史》将很大篇幅放在了刻画香农的生平及其影响上,可谓精当。
——刘韵洁(中国工程院院士)
此书写的历史:编码、电报、电话、信息;穿插之间的理论家和实践家:巴贝奇、爱达、贝尔、香农、图灵、维纳、柯尔莫哥洛夫;以及由这个信息史产生的理论:信息论、熵、编码、随机性。通过此书,读者好像在人类文明史、科学史的森林中漫步,吸取养分;好像在知识的海洋中漫游,极目远望。……书翻译得不错,比较流畅,专业术语翻译得也比较到位。这是这几年看到的比较成功的科学翻译作品。
——汤涛(香港浸会大学数学系主任,北京大学客座教授)
除了格雷克,很难设想还有谁能够以如此恢弘、理性而又充满诗意的文笔将“信息”融入人类文明的整体进程进行审视。他的宏大视野穿透了计算机、通信以及互联网的技术表象,从诗人拜伦之女爱达、艺术家摩尔斯、量子力学大师薛定谔、分子生物学家沃森、计算机科学先驱者图灵,一直谈到天才香农在贝尔实验室、普林斯顿高等研究院和麻省理工学院的非凡经历。格雷克让我们深信——香农所创造的绝不仅仅只是一个支撑起了通信技术体系的数学理论。如果说科学革命让“物质”和“能量”占据了我们的世界观,那么自香农创立信息论之后的六十多年,“信息”已然成为我们世界观的核心。
——王桥(东南大学信息科学与工程学院教授,哈佛大学访问科学家)
大家常说,我们身处一个“信息时代”。但转念想想,其实我们对于“信息”了解得并不多。詹姆斯·格雷克的《信息简史》让我们对信息有了全新的认识,这是一段愉快的阅读体验(尽管你需要耐下心来慢慢品味)。
——姬十三(果壳网CEO,科学松鼠会创始人)
通信的基本问题是,在一点精确地或近似地复现在另一点所选取的讯息。这些讯息往往都带有意义。
——克劳德·香农,《通信的数学理论》(1948)
在 1948 年这重要的一年之后,后来的人们自以为可以找出当时激发了克劳德·香农工作灵感的某些实用目的,但这只是事后猜测罢了。而他本人对此的看法迥然不同:我任由思绪信马由缰,种种设想会不时地冒出来。就像个科幻作家,我一直在思考的是:“假如是这样,事情又会如何呢?”
也正是在 1948 年,贝尔电话实验室对外宣布他们发明了一种小型电子半导体。这是“一种出奇简单的设备”,真空管能做的任何事它都能做,而且效率更高。它小巧玲珑,小到一个巴掌里放得下上百个。这年 5月,科学家们成立了一个委员会来为它命名。委员会给贝尔实验室的高级工程师发放了选票,列出了几个备选名字,如“半导体三极管”(semiconductor triode)、“微型真空管”(iotatron)、“晶体管”[transistor,由varistor(压敏电阻)和transconductance(跨导)两个词混合而成]等。最终,“晶体管”脱颖而出。“它可能将对电子和电信行业产生意义深远的影响。”贝尔实验室在新闻稿中这样宣布道。但这一次,现实超出了广告的溢美之词。晶体管引发了电子产业的革命,为电子技术的微型化和普遍应用开辟了道路,而它的三位主要发明人也很快获得了诺贝尔奖。对于贝尔实验室来说,它是皇冠上的明珠。然而,如果细究在那一年发生的重要进展,晶体管还只能屈居次席,因为它只是这场革命的硬件部分。
另一项更为意义深远、也更为基础的发明,出现在一篇专题论文中。这篇论文连载于7月和10月出版的两期《贝尔系统技术期刊》上,共79页。这次可没有什么新闻发布会。论文的题目既简单又宏大——《通信的数学理论》,而其传达的内容也很难用三言两语说清。但它是个支点,整个地球都将因此而被撬动。和晶体管一样,这项发明也引入了一个新词:比特(bit)。这个名字并没有经过什么委员会的投票,而是由这篇论文的唯一作者、时年32岁的克劳德·香农自行选定的。
现如今,比特已经跻身英寸、英磅、夸脱、分钟之列,成为量纲的一员。所谓量纲,就是测量的基本单位。
但它测量的是什么呢?“用于测量信息的单位”,香农写道,仿佛信息是种可测可量的东西。
表面上,香农是贝尔实验室数学研究组的成员,但他基本上独来独往。
当这个组撤离纽约的总部,搬到新泽西州郊野的新办公室时,他留了下来,常常待在旧办公楼的一个舒适的小开间里。这幢楼矗立在纽约西街上,是座12层高、沙砖结构的庞大建筑,背靠哈德逊河,面朝格林尼治村。香农不喜欢乘班车往返上下班,而是喜欢留在繁华的街区,在那里,他可以听到夜总会里吹奏的爵士黑管乐。那时,他正羞涩地追求一位在贝尔实验室微波研究组工作的年轻女士。微波研究组就在街对面的两层办公楼里,那栋楼原先是纳贝斯克饼干公司的厂房。大家都觉得香农是个聪明的小伙子。从麻省理工学院毕业后不久,他加入了贝尔实验室,从事与战争相关的工作,先是研发出了一种自动火控高射炮指挥仪,然后又集中精力研究保密通信(密码学)的理论,并用数学推导证明了所谓“X系统”的安全性——X 系统是指英国首相丘吉尔和美国总统罗斯福之间的专用电话线路。因此,上司即使弄不明白他留下来究竟要搞些什么名堂,倒也乐得对他听之任之。
在20世纪中叶,美国电话电报公司并不要求其研究部门立即产出什么成果,甚至允许它们在看不出具有明确商业目的的数学或天体物理学方面自由研究。尽管如此,它们所做的多数现代科学研究还是直接或间接地与公司力图使所有人都相互联系起来的使命息息相关。范围虽然广阔,但这家电话公司的核心业务量却一直以来没有明确的描述。据美国人口普查局年度统计摘要中有关“通信”的内容,截至1948年,每天有超过1.25亿次的通话要经过贝尔系统那2.22亿公里的电缆和3100万门电话机进行传输。但这些数字只是对通信量的粗略估算。摘要还统计了几千家无线电广播电台、几十家电视台的数据,以及报纸、图书、宣传手册和信函的数量。
邮局可以计算信函和包裹的数量,但贝尔系统传输的究竟是什么,又应该以什么单位来计数呢?传输的肯定不是通话,也不是字词,当然更不是字符。或许只是电而已吧。公司的工程师都是电气工程师,他们个个都明白,电在这里替代了人说话的声波,空气中的声波进入送话器就会被转换成电波。而电话之所以比电报先进,关键就是因为有了这种转换。作为电话的前驱,电报已然显得老旧而古怪了。电报有着完全不同的转换原理,它用的是点和划组成的编码,而且这套编码不是基于声音,而是基于书面的字母表(字母表本身也是一种编码)。细看之下,我们能发现这其中抽象和转换的链条:点和划代表字母表中的字母;字母代表声音,并相互组合成字词;字词则代表意义的某种根基,而这恐怕最好还是留给哲学家讨论吧。
贝尔系统早在1897年就聘请了公司的第一位数学家乔治·阿什利·坎贝尔。他是明尼苏达人,曾在哥廷根和维也纳学习。他很快遇到了早期电话传输中的一个严重问题:信号在电路中会失真,传输距离越长,失真就越严重。坎贝尔给出的解决方案既用到了数学,也用到了电气工程学知识。
他的老板则被告知不必太在意两者的差别。香农在学生时代就对成为工程师还是成为数学家犹豫不决,然而在贝尔实验室,不管愿不愿意,他都要面对电路和继电器。不过,他最乐此不疲的还是钻研抽象符号。大多数通信工程师都专注于物理问题,如放大和调制、相位失真以及信噪比降级等,香农则喜欢博弈和谜题。他最早被密码学吸引,始于年少时阅读埃德加·爱伦·坡的侦探小说。他像喜鹊一样搜集故事里的蛛丝马迹,试图去破解疑案。在麻省理工学院做研究助理的第一年,他的工作是操作一台百多吨重的原型计算机——万内瓦尔·布什制造的微分分析机。这台机器使用巨大的旋转齿轮、机轴和机轮来解微分方程。在22岁那年,香农在硕士论文中把一个19世纪的思想,即乔治·布尔的逻辑代数,应用到了电子电路的设计上。(逻辑和电,这是多么不寻常的组合!)后来,他又有机会与数学家、逻辑学家赫尔曼·外尔合作,后者教给他什么是理论:“理论允许意识‘跳出自身的影子’,超越经验而把握超验,但这只能借助抽象符号实现(这一点是不证自明的)。”
1943年,英国数学家、密码破译专家阿兰·图灵为了一个加密方面的任务造访了贝尔实验室。午餐期间,他与香农就人造思维机器的设想交换了意见。(“香农不仅仅想向这样一台大脑中输入数据,他还想把文化的东西灌输进去!”图灵惊呼道,“他想给它来点儿音乐!”
)香农同样也和诺伯特·维纳打过交道,维纳曾在麻省理工学院教过他,并在1948年提出了“控制论”这门研究通信和控制的全新学科。与此同时,香农也开始特别关注起电视信号来,不过视角比较独特。他在想,可否采用某种手法打包和压缩电视信号,从而更快地加以传输。逻辑和电路的结合产生了新的结晶,就像是基因和编码的结合一样。为了寻找一种统一的框架来梳理他头脑中的各种想法,香农开始着手整合一种有关信息的理论。
理论的原材料在20世纪早期的世界里随处可见,信件和口信、声音和影像、新闻和指令、数字和图表、信号和标识,不一而足。无论是通过邮局、电线还是电磁波,它们都在川流不息地流动着。然而,还没有一个词能够概括所有这些东西。香农在1939年写给麻省理工学院的万内瓦尔·布什的一封信中写道:“时断时续地,我一直在研究传递信息(intelligence)的一般系统的某些基本属性。”
intelligence一词有着悠久的历史,语意丰富。托马斯·埃利奥特爵士在16世纪写道:“现在 intelligence 作为一个文雅的说法,用来表示通过相互交换信件或口信达成协议或约定。”
不过除此之外,这个词还有了其他多个含义。一些工程师,尤其是贝尔电话实验室的工程师,开始使用information一词。他们用这个词来表达一些技术性概念,如信息的数量、信息的测量等。香农后来也采纳了这个用词。
为了能应用于科学领域,必须给信息(information)一词赋予某些特定含义。回首三个世纪前,当时物理学的发展已经到了难以突破的地步,但随着艾萨克·牛顿将一些古老但意义模糊的词(力、质量、运动,甚至时间)赋予新的含义,物理学的新时代开始了。牛顿把这些术语加以量化,以便能够放在数学方程中使用。而在此之前,motion(运动)一词(仅举此一例)的含义就与信息一样含混不清。对于当时遵循亚里士多德学说的人们而言,运动可以指代极其广泛的现象:桃子成熟、石头落地、孩童成长、尸体腐烂……但这样,它的含义就太过丰富了。只有将其中绝大多数的运动类型扬弃,牛顿运动定律才能适用,科学革命也才能继续推进。到了19世纪,energy(能)一词也开始经历相似的转变过程:自然哲学家选取这个原本用来表示生动有力或强度的词,使之数学化,从而赋予了它在物理学家自然观中的基础地位。
信息这个词也不例外,它也需要一次提炼。
而对它加以简化、精练,并以比特度量后,人们发现信息几乎无处不在。香农的理论在信息与不确定性、信息与熵,以及信息与混沌之间架起了桥梁。它的出现最终引发了光盘和传真机、电脑和网络、摩尔定律以及世界各地的“硅巷”。信息处理、信息存储以及信息检索等也应运而生。人们开始将铁器时代和蒸汽时代之后的时代称为信息时代。“人类曾经以采集食物为生,而如今他们重新要以采集信息为生,尽管这看上去有点不和谐。”
马歇尔·麦克卢汉在1964年如此评论道。
时值电子计算和赛博空间(cyberspace)刚刚出现,他的预言走在了时代的前面。
现如今,我们已经可以清晰地认识到,信息是我们这个世界运行所仰赖的血液、食物和生命力。它渗透到各个科学领域,改变着每个学科的面貌。信息理论先是把数学与电气工程学联系到了一起,然后又延伸到了计算领域。在英语国家称为“计算机科学”的学科,在一些欧洲国家则被称为了“信息科学”。现在,甚至连生物学也成为了一门研究讯息、指令和编码的信息科学。基因封装信息,并允许信息的读取和转录;生命通过网络扩散;人体本身是一台信息处理器;记忆不仅存储在大脑里,也存储在每一个细胞中;如此等等。而随着信息理论的兴起,遗传学也得以迅猛发展。DNA是信息分子的典型代表,是细胞层次上最先进的讯息处理器——它是一份字母表、一种编码,用60亿比特的信息定义了一个人。进化生物学家理查德·道金斯认为:“处于所有生物核心的不是火,不是热气,也不是所谓的‘生命火花’,而是信息、字词以及指令……如果你想了解生命,就别去研究那些生机勃勃、动来动去的原生质了,从信息技术的角度想想吧。”
生物体中的所有细胞都是一个错综复杂的通信网络中的节点,它们一刻不停地传输和接受信息,不停地编码和解码。进化本身正是生物体与环境之间持续不断的信息交换的具体表现。
“如此看来,信息环路成为了生命的基本单位。”研究细胞间通信长达30年之久的维尔纳·勒文施泰因如是说。
他提醒我们,信息一词在科学中比在日常生活中具有更为深刻的内涵:“它意味着一种组织和有序的普适原理,也是对此的精确衡量。”基因在文化上的对应物是模因(meme)。在文化的演化过程中,模因扮演着复制者和传播者的角色——它可能是一股思潮、一阵时尚、一封“连锁信”,又或是一种阴谋论。运气不好的话,模因也可能是种电脑病毒。
随着货币逐渐完成从实体到比特的转身,从而能够存储到电脑内存和磁条上,使世界金融得以在全球神经网络上运行如仪,经济学也逐渐认识到自身实际上是一门信息科学。即便是在货币看上去是一种物质财富,在口袋、货舱或银行金库里显得沉甸甸时,它也是一种信息。无论是硬币、纸币,还是金币、贝壳,它们都只不过是阶段性的技术,用以表明谁拥有什么的信息。
那么,原子呢?物质有它自己的“通货”,而所有科学中最硬的物理学看起来似乎已经臻于成熟。然而,物理学同样发现自身受到了一种全新思维模式的冲击。第二次世界大战以后,物理学家迎来了他们的黄金时代,当时科学界的重大新闻似乎都是有关原子裂变和核能利用的。物理学家将自身声誉和研究资源都押在了研究基本粒子及其相互作用规律、建造巨型加速器,以及发现夸克和胶子上。对于这门高高在上的学科而言,通信研究简直与它风马牛不相及。在贝尔实验室时,香农没有考虑过物理学的事,而粒子物理学家也不需要比特。
而后,突然之间,他们需要了。渐渐地,物理学家和信息理论学家殊途同归。比特是另一种类型的基本粒子:它不仅微小,而且抽象——它存在于一个个二进制数字、一个个触发器、一个个“是”或“否”的判断里。它看不见摸不着,但当科学家最终开始理解信息时,他们好奇信息是否才是真正基本的东西,甚至比物质本身更基本。他们提出,比特才是不可再分的核心,而信息则是万事万物存在的本质。对此,物理学家约翰·阿奇博尔德·惠勒(他的研究跨越 20 世纪和21世纪,是与爱因斯坦和玻尔都曾合作过的最后一位健在者
)就用了一句颇具神谕意味的、由单音节词组成的句子加以概括:“万物源自比特(It from Bit)。”
“任何事物——任何粒子、任何力场,甚至时空连续统本身”都源于信息。这为我们提供了另一种方式来解读观察者悖论:实验结果会因为它是否被观察到而受影响,甚至被决定。观察者不仅在观察,而且还在提问和讲述,而这些提问和讲述最终都必须由离散的比特表示出来。惠勒有点隐晦地写道:“我们所谓的实在(reality),是在对一系列‘是’或‘否’的追问综合分析后才在我们脑中成形的。所有实体之物,在起源上都是信息理论意义上的,而这个宇宙是个观察者参与其中的宇宙。”因此,整个宇宙可以看作一台计算机——一台巨大的信息处理机器。
而解开这个谜团的关键就是不见于经典物理学的所谓量子纠缠(quantum entanglement)现象。一旦粒子之间或量子系统之间发生了量子纠缠,那么即便相隔广袤的时空,它们的基本属性也仍然相互关联。即使相隔数光年,它们仍然能够共享某些实际存在,但又不只是实际存在那么简单的东西。这时会出现幽灵般的佯谬,无法解释,除非我们最终能够理解量子纠缠是如何编码信息的,无论是以比特的形式,还是以其量子力学对应物——量子比特(qubit)的形式。当光子、电子以及其他基本粒子发生相互作用时,它们实际是在做什么呢?其实是在交换比特、转换量子态以及处理信息,而物理定律就是处理信息时所用的算法。因此,每一颗正在燃烧的恒星、每一个星云、每一粒在云室中留下幽灵般痕迹的粒子,都是一台信息处理器,而宇宙也在计算着自己的命运。
那么,宇宙的计算量有多大?速度几何?它可以容纳多少信息,内存空间又有多大?能量和信息之间有着怎样的联系?翻转一个比特的能量开销又是多少?这些问题可不好回答,但它们也不像乍听上去那么神秘莫测。物理学家和量子信息学家(这是种新兴职业)正并肩奋斗来解答这些问题。他们计算之后,给出了初步的答案。(惠勒认为,“整个宇宙的比特数,无论以何种方式计算,都是 10的一个很大次方”。
而根据塞斯·劳埃德的说法,宇宙的运算能力“不会超过在10
90
个比特上执行10
120
次基本逻辑运算”。
)他们也以全新的视角来审视热力学的熵,以及臭名昭著的信息吞噬者——黑洞。惠勒因而宣称:“未来,我们将学会用信息的语言去理解和表达全部物理学。”
随着信息的功能越来越多,变得难以计数,它开始显得有些过多了。现在人们会抱怨说,“TMI(too much information,信息过多)”。信息疲劳、信息焦虑以及信息过剩,是我们遇到的新问题。而信息过载这个魔头及其恼人的走狗,如电脑病毒、电话忙音、网页死链以及PowerPoint演示文稿等,也让我们深受其害。所有这一切,同样多多少少也和香农有牵连。世界变化得实在太快。约翰·罗宾逊·皮尔斯(就是那个提出了“晶体管”这个名字的贝尔实验室工程师)在回顾香农提出信息论时可能受到的影响时说道:“现在很难还原在香农之前的人们所面对的世界图景。尽管我们可以阅读他们留下的著作,但我们很难重拾那种无邪、无知而蒙昧不察的状态。”
不过,我们对于过去确实有了新的认识。早在《新约·约翰福音》里就有说,“太初有道(word)”。而我们称自己的物种为“智人”(Homo sapiens),也就是有智慧的人;后来又有人单独区分了其中的现代人(Homo sapiens sapiens),也就是“智人中的智人”。普罗米修斯赠予人类的最宝贵的礼物,到底还不是火种:“我为人类发明了数,这是所有科学中最最重要的,还有排列字母的技术,这是缪斯诸艺的创造之母,借此可以把一切都牢牢记住。”
字母表是诸信息技术中的奠基性技术。而电话机、传真机、机械计算器,以及最终的电脑,它们只是用以存储、操作和传递知识的种种工具中的晚近发明。这些有用的发明已经融入我们的文化当中,成为我们日常词汇的一部分。比如谈到“数据压缩”,我们知道这和“压缩某种气体”的“压缩”截然不同。我们也知道信息可以被处理为信息流,被解析、分拣、匹配和过滤。iPod和等离子电视已成为我们家居的一部分,而发短信和用搜索引擎也融入了我们的日常技能。我们掌握这些技能,精于此道,才蓦然发现信息在生活中无处不在。但其实它一直都在那里。它曾经同样遍布于我们祖先的世界中,不论是实实在在的花岗岩墓碑,还是隐隐约约的窃窃私语,到处都有它的身影。打孔卡片、收银机、19世纪的差分机以及电报线路,都为编织那张我们身处其中的信息网作出了贡献。每一种新出现的信息技术,都在当时催生了信息存储和传输的新需求。随着印刷术的发明,出现了新的信息组织工具,如汇编词汇的字典、梳理知识的百科全书,以及整理事实的年鉴等。很少有信息技术会彻底过时,每一种新兴技术都会为其前辈技术赋予新的理解。因此,托马斯·霍布斯在17世纪时就抵制他所在时代的新媒体炒作,说:“印刷术的发明,固然是天才之举,然而较之于字母的发明,并没什么大不了。”
在某种程度上,他说得没错。每一种新出现的媒介,都会对人类思维的性质加以改造。长远来看,所谓历史,就是信息逐步从自发到自觉的一个过程。
有些信息技术在当时就会受到重视,有些则不会。但有一种技术,长久以来被严重误解,这就是非洲会说话的鼓。