控制力：麻省理工学院的经典理论最新章节_诺伯特·维纳著

6.什么是学习过程

将一个系统的过去演绩重新安排到系统当中，通过这种方式去达到控制系统的目的，这就是反馈。反馈的复杂程度则有赖于过去演绩在系统中的作用，如果过去演绩的在系统中只是调节和鉴定系统的数据，那么这种反馈就是简单反馈。简单反馈往往为控制工程师所用。只是，如果过去演绩的信息重新进入系统，并用来对系统的一般操作方法或者模式进行修正、指导时，那么这个过程就已经不单单是反馈，而是一种学习了。

下面我来举一个系统学习的例子——预测机的设计工作。第二次大战爆发初期，各个参战国虽然都投入使用了新型武器，但是防空方面的效率却并不高。而空军作战又是战争的必然选择，所以在这种背景下就有必要发明一种仪器去对飞机的位置和距离进行跟踪定位，并对炮弹击中飞机在空中所经历的实际时间进行准确计算，同时目标飞机在这段时间内的飞行位置也需要准确考虑。

如果敌方飞机在作战过程中采取完全随机的逃避动作，那么即使再精密的仪器和娴熟的技巧都不可能掌控飞机的最终位置。但是这种顾虑对预测机的发明并无多大影响，因为在很多情况下飞机驾驶员并不会或者说不能采用随意的逃避动作。

这是因为空中飞行不同于陆地，飞行员会受到多种事实的限制，例如，如果驾驶飞机在空中急速转弯，那么驾驶员就会受离心力影响而失去知觉。同时，任何一个驾驶员的驾驶行为和过程都会受到实际训练经验和规则的制约。过往的训练会在无形中让他们遵守一些有规律的控制习惯，哪怕是在战场上的逃避动作也不会超越这些习惯。虽然所谓的习惯和规律都不是绝对的，不同的驾驶员会存在着不同的偏好，而且不同的机型也必然会有不同操作要求，但是通过统计人们是会找到其中的趋势。

所以我们只要记住这一点，对飞机这样一类快速移动的目标进行追踪时，拿出仪器去计算飞机将会飞向何处是不切实际的，同时飞行员也不会给对手时间去计算自己的坐标。因此所有的计算程序必须编入到炮弹的控制系统当中，而且这个计算程序必须精确，包括不同类型的飞机在以往不同的飞行条件下的种种经验统计数据都是需要纳入总数据库的。现在所有的高射炮控制系统内都安装着一个起这种作用的校准仪器，而校准仪器所使用的就是经验统计的固定数据，此外，其他一些仪器也会使用几个固定数据，这就需要系统根据实际情况对这些数据进行选择。炮手在按下发射按钮之后，这些仪器就会根据炮手的需要而对数据做出正确的选择。

只是解决了数据问题，预测机还存在着另外一些控制问题，而这个问题也同样可以采用机械方法去解决。上文中所提到的数据仪器的设计过程本身是一个数学问题，即通过实际观测飞机的飞行来得到统计数据，然后将这些数据录入系统，变成一种规则并实现对高射炮的控制。同依据实际观测追踪飞机的方法相比，前一种方式似乎要缓慢一些，因为要实现这种办法需要做大量的前期工作，包括对飞机过去的飞行情况进行各种观测和统计。

但二者快慢的比较只是相对的，虽然前者的前期工作相对烦琐，不过它却能发挥更准确的效用，只是它要付出时间。而且随着技术的进步，人们通过科技手段缩短这一时间也成为可能。所以在未来世界可能会出现一种防空武器，它可以自发式地对天空中的飞行目标进行监测和统计，然后对自身统计的材料进行加工，进而依据它们拟定出一种控制系统。最后，这种控制系统会自动调整自己的参数，让武器的位置能够精确地对准空中飞行的目标，在观测的同时也可以随时发动攻击。

当然，我们生活的这个时代还没有做到这一点，但是我可以确定的是它已经被纳入研究范围。而且不仅仅是战争，对于其他方面的预测它也将发挥重大作用。

防空武器可以以目标的移动来调整自己的程序，继而对目标进行完成观测、瞄准和射击的任务，从本质上来说这就是一种学习行为。同时，它也是一种反馈过程，防空武器的参数变化是计算机构中程序自带的调节系统带来的，这个过程同数字数据的解释过程几乎全部相同。从本质上来说这只是一种非常常见的反馈形式，能够让系统跟随实际情况的变化而做出改变。

在这里，我们所探讨的高级学习过程仍然不可避免地受到所在系统的种种条件限制，很显然这种过程同人的学习过程存在本质上的不同。但是，我们依旧可以从这一过程出发，通过这个出发点去推导，让所有可能多的复杂学习过程变得更为有序和机械化。

洛克的联想理论以及巴普洛夫的条件反射学说都从各个方面为这种方法提供了思想理论上的指导，当然在进行这方面的探讨之前我需要先向大家做一些普通的解释，这有助于对我的观点的一些反对意见进行解答。