当我在13年前写作《控制论》的第一版时,由于一些困难的限制,结果低级的印刷错误成堆,也有内容方面的错误。今天,我相信重新审视控制论这本书的时候到了。我们不但要以将来有一天会实行它包含的计划这一角度来审视它,同时也要把控制论作为一门当今的科学。因此,我利用这个机会对本书做一些必要的修改,把这个课题在眼下的广泛进展介绍给我的读者们,同时还介绍第一版发行以来出现的新的有关思考模式。
如果一个新的科学课题具有真正的生命力,人们对它的兴趣必然也应该随着时间跟着它转移。当我第一次写作《控制论》的时候,我发现阐述自己观点的主要障碍是,统计信息及控制理论的概念对于当时的主流学术界是全新的,甚至可能是令人震惊的。今天,对于通讯工程师和自动控制设计师来说,这些已变成了如此熟悉的一个工具,以至于我必须警惕的主要危险变成了,本书可能显得平庸且过时了。在工程设计和生物学领域,反馈的概念已经完整地建立了,信息的作用及其测量与传输,对于工程师、生理学家、心理学家和社会学家来说,构成了一门完整的学科。本书第一版仅仅略加提及的自动机,已经自己发展起来,同时,我不但在本书而且在它的有名的小姊妹篇《人有人的用处》 中,所警示的由此产生的社会危险,已经从地平线上高高升起。
于是理所应当的,控制论学者应该转向新的领域,并且把大部分注意力转到过去十年发展起来的新思想上去。简单的线性反馈,它的研究在唤醒科学家们去研究控制论时,曾经是多么的重要,如今它看起来比人们第一次看到它时,远非那么简单同时远非那么线性。事实上,在电路理论的早期,电路网络的系统分析处理没有超越电阻、电容和电感的线性连接。这意味着,整个课题使用信息传输的谐波分析、信息所通过的电路的阻抗、导纳、电压比来描述就足够了。
在《控制论》出版之前很久,人们意识到非线性电路(例如我们在许多放大器、稳压器、滤波器等等见到的)的研究不容易套进前面所说的框架中。于是,由于需要一种更好的方法,人们做了许多尝试把旧电工学的线性表述大大扩展,直至新型器件可以自然地得到描述。
当我在1920年前后来到麻省理工学院时,人们一般都用这样的模式来研究非线性器件,即寻找阻抗概念的一种直接推广,既描述线性系统,又描述非线性系统。其结果就是非线性电工学的研究进入这样的一种状态,它可以和托勒密的天文学系统的最后阶段相比较,在这个天文学系统中,行星轮曾经堆叠在行星轮上,修正堆叠在修正之上,直到形成一个无限巨大的补丁结构,最终由于其重量而坍塌。
作为类比,哥白尼系统出自于筋疲力尽的托勒密系统的沉船残骸,哥白尼使用简单而自然的日心说来描述天体的运动,放弃了复杂而含混不清的托勒密地心说;同样,非线性系统和结构的研究,无论是电的还是机械的,也无论是自然的还是人工的,都需要一个崭新独立的起点。我在我的《随机理论中的非线性问题》 这本书中,尝试着提出一种新的方法。原来,当我们考虑非线性现象时,处理线性现象时具有压倒重要性的三角分析不再能沿用。这里有一个清晰的数学原因。电路现象像很多物理现象一样,是对时间原点的平移具有不变性的。一个物理实验如果我们从正午开始,到2点它将达到某一个阶段;那么如果我们从12点15分开始,到2点15分这个实验也将达到相同的阶段。物理定律就这样遵循着时间平移的不变性。
三角函数sin nt与cos nt对于相同的平移群具有某些重要的不变性。一般的函数
当我们在t上加τ作出平移以后,将变成
结果,
换言之,函数族
以及
在平移下具不变性。
还有其他函数族在平移下具不变性。让我们考虑一个所谓的随机游走,其中一个粒子在任意时间间隔的运动具有一种分布,它仅依赖于该时间间隔的长度,而与其初始化之前发生的一切事件无关,那么在时间平移下,随机游走的结果将回到它自己。
换言之,三角函数曲线的单纯平移不变性是一个被其他函数集共享的性质。
除了这些不变性,三角函数特有的性质有
于是这些函数构成了一个极其简单的线性集。我们注意到这个性质与线性有关。即,我们可以将一个给定频率的所有的震荡简化到两项的线性组合。正是这个特性,在电路的线性处理中创造了谐波分析的价值。函数
是平移群的特征,同时产生了这个群的线性表述。
但是,当我们处理与常数相加之外的函数操作时-例如当我们使两个函数相乘时-简单的三角函数不再显示这个基本的群性质(平移)。另一方面,随机函数,例如出现在随机游走中的,确实具有某些性质,非常适合关于它们非线性组合的讨论。
我几乎没有愿望在这里讨论这个工作的细节,因为这在数学上非常复杂,同时它在我的书《随机理论的非线性问题》中已经包含了。那本书的材料在一些具体的非线性问题的讨论中已经被充分应用,但是在执行那里列出的计划中有很多内容有待完成。在实践中它所归结到的是,对于非线性系统研究,合适的试验输入具有布朗运动性质,而不是一组三角函数。在电路的例子里,这个布朗运动函数从物理上可以用散粒效应产生。这个散粒效应是电流的一种不规则现象,它是由以下事实引起:电流不是一种电的连续流体,而是一系列一个一个的相同的电子。这样,电流就要服从统计不规则性,其本身具有一种均匀的性质、可以被放大到这样的程度使其构成一种可以感觉的随机噪声。
如我将在第9章展示的,这个随机噪声理论不但可以在电路及其他非线性过程的分析中得到实际应用,而且可以用于它们的合成 。所使用的方法是一个非线性工具输出的简化,这个工具具有随机输入到一系列完整定义的正交函数,这些函数与埃尔米特多项式密切相关。一个非线性电路的分析问题就是要决定这些多项式的系数,这是通过平均过程输入的某些参数中完成的。
这个过程的描述相当简单。除了代表尚未分析的非线性系统的黑匣子以外,我还有一些已知的结构体,它们我称之为白匣子,代表了所需扩展的各个项 。我把同样的随机噪声放入黑匣子以及一个给定的白匣子。在黑匣子开发中,白匣子的系数是由它们输出的乘积的平均值给定。虽然这个平均需要对散粒效应的整个输入集来做,有一个定理允许我们用时间平均,在整个集中除了一组几率为零的点之外,取代上面的平均。为了得到这个平均,我们需要自由地使用一种乘法工具,用它我们能够得到黑、白匣子输出的乘积,以及一种平均工具,我们能够使它基于以下事实:一个电容器两端的电势正比于电容器中持有的电量,因此正比于流过它的电流的时间积分。
要决定那些一个一个加入黑匣子的等效示意图的每一个白匣子的系数,不但是可能的,而且还能够同时地决定这些量。甚至,通过使用适当的反馈器件,能够使每一个白匣子自动调节到一个对应它在开发黑匣子中的系数,这样一个水平。这样,我们就能构造出一个多重白匣子,当它适当地连接到一个黑匣子并且接受相同的随机输入,将会自动形成一个黑匣子的等效运行模块,哪怕它内部结构可以截然不同。
分析、合成、白匣子自动调节成为类似黑匣子,这些操作可以由阿玛尔·玻色教授 和加博尔教授 描述的其他方法执行。在所有这些当中,有一种使用了某种工作或者学习的过程,通过为黑匣子和白匣子选择适当的输入并作比较;在许多这样的过程中,包括玻色教授的方法,乘法器起了重要的作用。虽然有许多途径来解决两个函数“电相乘”的问题,在技术上这个问题是不容易的。一方面,一个好的乘法器必须能在一个大的幅度范围里工作;另一方面,它的运算必须几乎是瞬时的以便在高频时也是准确的。加博尔宣称他的乘法器频率范围可达1000赫兹。他作为伦敦大学帝国科技学院电气工程教授的主席,在他的开幕演讲中,他没有明确阐明他的乘法有效适用的幅度范围,也没有说明得到的精确度。我正在急切地等待这些指标的明确说明,以便我们对在其他依赖这个乘法器的装置中使用,做出完善的评估。
一个装置基于过去的经验呈现一种特定的结构或者功能,所有这些器件导致一种在工程学和生物学上有趣的新高度。在工程学上,特性类似的器件不但可以用来玩游戏和完成其他有目的的行动,而且在这当中,基于过去的经验连续改进性能。我将在本书第9章里讨论一些这样的可能性。在生物学上,我们至少有一个也许是生命的中心现象的类比物。为了使遗传成为可能以及为了细胞倍增,有必要使一个细胞的遗传承载部分-所谓的基因-能够以它们自己的形象构造别的类似的遗传承载结构。因此,对于我们来说具有一种手段,使工程结构能够产生与它们自己类似功能的其他结构,这是非常激动人心的。这我将用第10章来讲这个题目,特别我将讨论,一个给定频率的振荡系统如何将其他振荡系统还原到相同的频率上来。
经常有这样的叙述:现存分子的影像里任何一种具体分子的产生,与在工程学中使用模板有相似性,在工程学的模板里我们能使用一台机器的一个功能元件作为样板而造出另一个类似的元件。模板的影像是静态的,一定有某个一种基因分子制造另一种的过程。我给出下面试验性的建议:分子光谱的频率也许是承载生物物质标识的样板元素;而基因的自组织也许是频率自组织的表示,这一点我将在后面讨论。
我已经一般性地谈到机器学习。我将把一章投入到更详细地讨论这些机器、潜力以及使用它们的一些问题。在这里,我想做几个一般性的评论。
在第1章可以看到,机器学习的概念与控制论本身一样古老。在我描述的防空预测器里,用于任何给定时刻的预测器的线性特征,取决于长时间地熟悉我们想预测的时间序列集合的统计。虽然,关于这些特征的知识可以按照我在那里给出的原理用数学方法获得,我们完全可能配置一台计算机来获得这些统计并研究出预测器的短期特征,这种研究基于用于预测的同一台机器已经观测到的、同时自动获得的经验。这能够远超过纯线性的预测器。在卡连布尔、玛萨尼、阿库托维奇和我 的各篇论文里,我们提出了一种非线性预测理论,它可想而知至少能够与使用长期观测的方式类似地,以机械化的方式给出短期预测的统计基础。
线性和非线性预测的理论都涉及某些预测切合度的标准。最简单的标准,虽然绝非唯一可用的,是均方误差最小。这被用于与布朗运动的泛函相联系的一种特殊形式,布朗运动被我用于建构非线性装置,因为我研究得到的各个项具有某些正交性。这些情况保证了有限数目的这些项的部分和,是被模仿的装置的最好模拟,应用这些项可以做到这一点,假如维持均方误差的标准的话。加博尔的工作也依赖于均方误差标准,但是他以一种更广义的方式,适用于经验取得的时间序列。
机器学习的概念能够把它的应用远远地扩展到预测器,滤波器,和其他类似的装置。这对从事竞争性的例如跳棋这样的机器的研究与构建特别重要。这里,最关键的工作已经由IBM实验室的塞缪尔 和渡边 完成了。在滤波器和预测器的研究中,研发了时间序列的某些函数,由此能够扩展出一个更大类别的函数。这些函数能够有极大量的数值解,而游戏的得胜依靠这些解。例如,它们构成了双方棋子的数目,这些棋子的指令总数,其移动性,等等。在使用机器一开始的时候,对各种考虑给出试验权重,而机器按总权重有一个极大值选择可接受的动作。到这一时刻,机器还是根据僵硬的程序来工作,还不是一个学习机。
然而,机器不时地承担一个不同的任务。它尝试着扩展那个1为赢、0为输、也许1/2为平局的函数,它借助于各种函数来表达机器能够认识事物的考虑。就这样,它重新决定这些考虑的权重,以便于能够玩更复杂的。我将在第九章讨论这些机器的某些性能,但是这里我必须指出,这些机器已经相当成功:机器在10到20小时的学习以及工作,能够打败它们的程序员。在那一章里我也愿意提及,已经在类似的机器上做了某些工作,这些机器是设计用于证明几何定理,以及在有限程度上模拟逻辑归纳。
所有这些工作是“编程的编程”的理论与实践的一部分,这个题目在麻省理工学院的电子系统实验室里已经做了广泛的研究,在这里人们已经发现,如果不使用这样的自学器件,对一个模式僵硬的机器编程,本身是一件极其困难的任务,同时,我们急需对这种编程进行编程的器件。
既然机器学习的概念适用于那些我们自己制造的机器,那么它也关系到那些我们称之为动物的活的机器,结果,我们就有可能打开生物控制论的大门。在这里,我想在各种各样当前的研究中,挑出一本斯坦利-琼斯论述生命系统 控制论的书。在这本书中,他们投入大量篇幅关注神经系统维持工作水平的那些反馈,同时也关注应答特殊刺激的其他那些反馈。因为系统的水平与特定的应答之结合,在相当程度上是可以相乘的,所以它也是非线性的,包含了我们已经谈及的那种考虑。这个领域的活动如今极其活跃,我期待它最近将变得更加活跃。
我迄今所给出的记忆机器的方法,以及自乘机器的方法之大部分,虽然不是全部,依赖高度专业化的装置,或者我可以称之为蓝图装置。这个相同过程的生理学方面必须更加符合生物体的奇特的技术,其中蓝图被代之以一种不特定的、系统自组织的过程。本书第十章致力于一种自组织过程的样本,即通过此过程在脑电波中形成了一些狭窄的、高度个别的频率。因此,这大部分是前一章在生理学方面的孪生篇章,那里我在一种蓝图的基础上讨论了类似的过程。在脑电波里存在尖锐的频率,以及我给出的理论解释它们来自于哪里、它们能够做什么、以及它们有什么医学用途,这一切在我的脑海里代表了一种生理学的重要的新突破。类似的思想能够用于生理学的许多其他地方,并且能够对生命现象的基础研究做出实在的贡献。在这个方面,我所给出的多少是一种计划而不是已经完成的工作,但是,这是一个我抱有巨大希望的计划。
在本书第一版以及在目前这版中,我都没有企图把这本书作为控制论所有做过的工作的概要。我的兴趣和我的能力都达不到。我的意图是在这个课题上表达并放大我的思想,以及展示一些思想以及哲学思考,它们在开始的时候引导我进入这个领域,并且在其发展中继续吸引着我。所以,这是一本极其个性化的书,大量篇幅致力于我自己感兴趣的那些研究,对于那些我自己没有工作过的内容较少投入。
在修改本书中,我在许多方面得到了宝贵的帮助。我特别必须感谢MIT出版社康斯坦斯·D.博伊德小姐的合作,东京理工学院花原世高博士,MIT电气工程系李郁荣博士,贝尔电话实验室戈登·赖斯贝克博士。同时,在写作我的新章节时,特别在第十章的计算里,在该章里我考虑了自组织系统其在脑电图的研究中彰显了自己,我愿意提及我从我的学生那里接受的帮助:他们是,约翰·科特利和查理斯·E.罗宾森,特别是马萨诸塞州总医院约翰·S.巴洛的贡献。詹姆士·W.戴维斯完成了索引。
没有所有这些人的细致用心和投入,我不会有这样的勇气或精准来生产一个新的校正过的版本。