购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

什么是记忆

如果说一本地图册包含关于世界的“信息”,那么,书的状态与世界的状态之间就存在着一种关系;具体而言就是指,书中文字和图片的分子的位置与大陆的位置之间存在着一种关系。如果大陆变换了位置,书中的分子也会变换位置。我们人类存储信息的设备多种多样,从书籍到大脑,再到硬盘,这些设备都有一个共同点:它们的状态能与我们关心的事物产生某种关系,因此也能告诉我们有关这些事物的信息。

那么,是哪一项基本物理定律允许这些设备可以被用作“记忆装置”,即存储信息的装置的呢?答案是,它们都能够处于许多不同的长期状态,这些状态能够保持足够长的时间,长到足以把信息编入系统中,直到它被需要的那一天。举个简单的例子,假设有一个崎岖不平的曲面,上面有16个“山谷”,如图2-3所示。你将一个小球放到这个曲面上,它就会滚落到“山谷”中。一旦小球停下来,它一定会位于16个位置中的其中一个上,因此,你可以用它的位置来记忆从1~16的任意一个数字。

这个记忆装置是相当稳健的,因为即使它受到外力的摇晃或干扰,小球也很可能会保持在原来的那个“山谷”中,所以,你还是可以读出它存储的数字。这个记忆之所以如此稳定,是因为想要把小球拿出山谷所需的能量,比随机干扰所能提供的能量多得多。除了曲面上的小球之外,这个原理还可以被运用到更广泛的情况中,以提供稳定的记忆,复杂物理系统的能量可能依赖于各种各样的力学、化学、电学和磁学性质。不过,对于一个你希望记忆装置“记住”的状态,如果它需要一定的能量才能改变这个状态,那么这个状态就是稳定的。这就是为什么固体拥有许多长期稳定状态,而液体和气体却没有;如果你把某人的名字刻在一枚金戒指上,多年以后,这个信息依然在那里,因为重铸金子需要很大的能量,但如果你把它“刻”在池塘的水面,不到一秒钟,这个信息就会丢失,因为水面的形状不费吹灰之力就可以改变。

图2-3 记忆装置的物理定律

注:如果一个物理实体可以处于许多不同的稳定状态,那么它就可以用作“记忆装置”。左图中的小球编码了4个比特的信息,代表它处在2 4 =16个“山谷”中的其中一个中。右图中的4个小球共编码了4个比特的信息,每个小球编码了1个比特的信息。

最简单的记忆装置只有两种稳定状态(如图2-3的右图所示)。因此,我们可以认为它是用二进制数字(简称“比特”),也就是0和1来编码信息的。同样地,复杂一些的记忆装置可以用多个比特来存储信息:比如,图2-3右图中的4个比特组合起来可以有2×2×2×2=16种不同的状态:0000,0001,0010,0011,…,1111,因此,它们组合起来的记忆能力与更复杂一些的16态系统(如左图所示)是完全相同的。因此,我们可以把比特视作信息的“原子”,也就是不能被继续细分的最小信息单元,它们组合起来可以表示任何信息。举个例子,我刚在笔记本电脑上打出了“word”这个单词,在电脑的内存中,它用一个由4个数字组成的序列来表示:119 111 114 100,每个数字存储为8个比特,每个小写字母的编码是96加上它在字母表中的序数。当我在键盘上敲出“w”这个字母时,我的笔记本电脑屏幕上显示出了“w”的视觉图像,这个图像同样也是由比特来表示的:电脑屏幕上共有几百万个像素,每个像素需要32个比特来规定它的颜色。

由于双态系统生产和使用起来都很容易,大多数当代计算机都是用比特的方式来存储信息。不过,比特的体现方式多种多样。在DVD碟片上,每个比特代表其塑料表面上某一点是否存在一个微型凹坑。在硬盘中,每个比特代表它表面的某个点采用的是二选一的磁化方法。在我笔记本电脑的工作内存中,每个比特代表决定“微型电容”是否充电的某个电子位置。某些比特可以方便地传输,甚至能达到光速:例如,在你用来发送电子邮件的光纤中,每个比特代表一个激光束在某一时刻是强还是弱。

工程师喜欢将比特编码进那些不但稳定易读(就像金戒指),而且易于写入的系统中,比如硬盘,改变硬盘的状态所需的能量可比在金子上刻字少多了。他们还偏爱那些使用起来很方便,并能很便宜地进行大规模生产的系统。但除此之外,他们并不关心比特在物理实体中是如何体现的,大部分时候,你也不会关心这件事,因为它根本不重要!如果你通过电子邮件给你的朋友发送了一个需要打印的文件,从硬盘上的磁化到电脑工作内存中的电荷、无线网络中的无线电波、路由器的电压以及光纤中的激光脉冲,信息会以极快的速度在其中复制,最终换句话说,信息仿佛拥有自己的生命,而与它的物质形态如何没有关系。确实,我们感兴趣的只是这些独立于物质形态的信息,如果朋友给你打电话讨论你发送给他的那份文件,他并不是要和你讨论关于电压或分子的事情。这是我们获得的第一个启示: 智能这样的无形之物可以体现在有形的物质形式之上。 接下来我们将会看到,“物质层面的独立性”这种属性其实具有更深的意义,不仅涉及信息,还与计算和学习有关。

正因为信息可以独立于物质形态而存在,聪明的工程师们才能一次又一次地用新技术更新计算机的记忆装置,而不需要对软件做任何改变。结果相当惊人,如图2-4所示,在过去的60年里,每隔几年,计算机内存就会变得比之前便宜一半。硬盘的价格便宜了1亿倍,而主要用于计算而不只是存储的快速内存的价格骤降了10万亿倍。如果买东西时我们也能获得“99.99999999999%”这么大的折扣力度,那么你只需要花10美分就能在纽约市买一栋房子,也只需花1美元就能买下人类历史上开采出来的所有黄金。

图2-4 过去60年里,计算机内存的变化趋势

注:在过去的60年里,每隔几年,计算机内存就会比过去便宜两倍,相当于每20年便宜1 000倍。一个字节等于8个比特。数据来源于约翰·麦卡勒姆(John McCallum),详细数据请查看http://www.jcmit.net/memoryprice.htm。

对许多人来说,存储技术的巨大进步都与自己的成长息息相关。我记得上高中时,为了买一台内存为16KB的计算机,不得不在一家糖果店里打工。我和我的同学马格努斯·博丁(Magnus Bodin)为这台计算机写了一个文字处理软件,当时我们被迫用超级紧凑的机器码 来写,就为了给它要处理的文字信息留点空间。在习惯70KB内存的软盘之后,我被3.5英寸大的软盘震惊了,因为它体积更小,却能存储1.44MB的内容,足以装下一整本书。后来,我拥有了我人生中的第一个硬盘,它可以存储10MB的内容,放到今天,它可能连一首歌曲都装不下。这些青春期的故事回忆起来很不可思议,因为今天的我花100美元就能买到一个比以前的存储空间大30万倍的硬盘。

这些都是人类设计的记忆装置。那么,那些进化而来的记忆装置呢?生物学家还不知道第一个能够复制上一代蓝图的生命形式是什么,但我们猜想,它可能非常微小。2016年,剑桥大学的菲利普·霍利格(Philipp Holliger)带领团队制造了一个RNA分子,它编码有412个比特的遗传信息,能够复制比自己更长的RNA链。这个成果为一个叫作“RNA世界”(RNA world)的假说提供了支持。这个假说认为,早期的地球生命与一些能自我复制的RNA短片段有关。目前,已知进化产生并生存于野外的最小记忆装置是一种名叫Candidatus Carsonella Ruddii的细菌的基因组,它可以存储40KB的信息,而我们人类的DNA能存储1.6GB的信息,与一部电影的大小差不多。正如在第1章提到的,我们大脑存储的信息比基因多多了:大脑中差不多有10GB的电子信息,它们详细描述了在任意时刻,在你的1 000亿个神经元中,有哪些正在放电;还有100TB的化学/生物信息,它们详细描述了神经元之间突触连接的强度。将这些数字与机器记忆相比较,你就会发现,当今世界上最好的计算机的记忆能力比任何生物系统都强大,并且,它们的价格下降得非常快,到了2016年,只需要几千美金就可以买到。

大脑的记忆原理与计算机的信息存储原理截然不同,这不仅体现在它的构成上,还体现在它的使用方式上。 你在计算机或硬盘上读取记忆的方式是通过它存储的位置,但你从大脑中读取记忆的方式则是依据它存储的内容。 在计算机内存中,每组比特都拥有由一个数字组成的地址。当需要读取某些信息时,计算机检索的是它的地址,这就好像在说:“请你从我的书架上取出最顶层从右往左数的第5本书,然后告诉我第314页上说了什么。”相反,你从大脑中读取信息的方式却更像搜索引擎:你指定某个信息或与之相关的信息,然后它就会自动弹出来。比如,当你听到“生存还是……”这个短语时,它很可能会在你脑中触发“生存还是毁灭,这是一个值得考虑的问题”这句话;如果你在网上搜索这个短语,搜索引擎也很可能会给你同样的搜索结果。实际上,即便我引用的是这句话中的另外一部分,甚至弄混一些字词,结果可能还是一样的。这种记忆系统被称为“自联想”(auto-associative),因为它们是通过联想而不是地址来进行“回想”的。

1982年,物理学家约翰·霍普菲尔德(John Hopfield)在一篇著名的论文中向人们展示了一个由互相连接的神经元组成的网络,它能够实现自联想记忆的功能。我觉得他的基本观点非常棒,对于许多拥有多个稳定状态的物理系统来说,这个观点都成立。例如,一个小球位于一个拥有两个“山谷”的曲面上,就像图2-3中显示的单比特系统那样。让我们对这个曲面做一点设定,让两个最低点的 x 坐标分别为 x =π≈3.14159。如果你只记得π与3很接近,但不记得π的具体值,那么你只需要把小球放到π=3处,然后看它滚落入最近的最低点,它就能向你揭示出一个更精确的π值。霍普菲尔德意识到,一个更复杂的神经元系统可以提供一个类似的“地形”,其上有许许多多能量极小值,系统可以稳定在这些能量极小值上。后来人们证明,你可以在每1 000个神经元中塞进多达138个不同的记忆,而不会引起较大的混乱。 gDOYDhCYKWqkDhuiDWC84EQ+lKMgvB5d7Qxj1y9LnrSzVO0igz7UiQToXpCWad5T

点击中间区域
呼出菜单
上一章
目录
下一章
×