定义3.1 (不可管理性):在赛博管理学中,管理者和管理目标都是赛博系统,比如,分别记为 J 1 ( y , w )和 J 0 ( y , w )。如果在可接受的时间段内的某时刻 t ,成立
J 1 ( y , w )= J 0 ( y , w )
或 J 1 ( y , w )与 J 0 ( y , w )之间的距离dis( J 1 ( y , w ), J 0 ( y , w ))小于可容忍的误差值,那么,就称目标系统 J 0 ( y , w )是可管理的,或更准确地说,该目标系统是可被管理者 J 1 ( y , w )管理的。否则,就称为目标系统 J 0 ( y , w )是不可管理的,或更准确地说,该目标系统是不能被管理者 J 1 ( y , w )管理的;于是此时,在可接受的时间段内,管理者与目标之间的距离的最小值dis( J 1 ( y , w ), J 0 ( y , w ))总是大于可容忍的误差。
为了更准确地理解上述不可管理性的定义,特补充说明以下几点:
(1)此处并未限定管理者 J 1 ( y , w )和目标系统 J 0 ( y , w )的维数,比如,它们可以是任意 N 维向量空间,即它们的系统输出状态都可用 N 维向量来表示;当然,为了便于理解,我们经常只考虑一维的情况。
(2)此处对距离dis(·,·)也几乎没有限制,即只要它满足下面的三角不等式
dis( A , C )≤dis( A , B )+dis( B , C )
就行了,即任意两边之和,大于第三边;这里 A 、 B 、 C 是 N 维空间中的任意向量(为便于理解及简化表示,这里只考虑一维情况)。当然,为了便于理解,dis(·,·)可以取为常用的欧几里得距离或汉明距离等。
(3)此处“可接受的时间段”,由具体案例确定,比如,当目标系统 J 0 ( y , w )是黑客攻击行为时,那么,“可接受的时间段”就应该是在黑客的攻击结束前,否则管理者 J 1 ( y , w )的安全保障行为,就成了“马后炮”。
(4)此处“可容忍的误差值”也是由具体的案例确定的,比如,若目标系统是控制计算机病毒的快速传播,那么在一般的公众网络中,只要能阻止病毒泛滥就可容忍了,因为不可能绝杀所有病毒。
(5)此处之所以只强调“某时刻 t ”达到目标系统就可以了,这是因为,在这样的假定下,不但理论分析更简单,而且应用于实践中也足够了,没必要多次反复地达到目标;即使在某些特殊情况下,需要多次达到目标,那么只需要将“一次达到目标的过程”重复进行就行了。
若用导弹来类比,可以使定义3.1更形象:此时可将管理者 J 1 ( y , w )看成攻击导弹,而将管理目标 J 0 ( y , w )看成被攻击导弹。如果本次打击脱靶了(即没击中目标,或没进入攻击导弹的“近距离爆炸”范围内),那么,就称目标系统 J 0 ( y , w )是不能被管理者 J 1 ( y , w )管理的。显然,在以下两种不可管理的情况下,攻击导弹几乎一定会脱靶。
不可管理的情况1:被攻击导弹 J 0 ( y , w )飞得更快,此时,逃避被管理的最简单策略就是背离 J 1 ( y , w ),尽管直飞就行了。
不可管理的情况2:被攻击导弹 J 0 ( y , w )的反馈更及时,微调更灵活;就像羚羊用几个急转弯,就能把跑得更快的猎豹甩掉一样。
总之,只要目标系统拥有“速度”优势(情况1)或“转向”优势(情况2),那么,它就是不可管理的了。因此,下面的讨论,都假定情况1和情况2不会发生。而由于运动的相对性,只要情况1和情况2不出现,那么管理者就应该能够“锁定”目标;换句话说,只要“反馈、微调和迭代”得当,那么“坐”在攻击导弹 J 1 ( y , w )上的人,盯着目标系统 J 0 ( y , w )时,他可以看到这样的情形:目标好像始终是“静止”的!到此,我们就完成了赛博管理的第1次工程简化,即工程简化I。
工程简化I :除上述情况1和情况2之外,赛博管理其实可以假定目标系统是静止的,比如,目标就是原点(0,0,…,0)。管理者 J ( y , w )能否成功,就取决于它是否能击中该原点。因此,本书今后就可以不再同时出现 J 1 ( y , w )和 J 0 ( y , w )了,而是统一用 J ( y , w )来代替管理者系统就行了。
于是,从理论上可以形象地说:在导弹 J ( y , w )的轨迹附近的目标,都是可管理的;而其他目标则都是不可管理的,或都是不能被该系统 J ( y , w )所管理的。而这里的“附近”,形象地意指攻击导弹预设的“近距离爆炸区域”,即进入该区域后,导弹就会爆炸,即使它并未碰到目标;从理论上看,该“附近”意指定义3.1中的“可容忍误差值”。因此,可管理的区域,其实是很小的。比如,若固定的目标点在东,而你却向西发射了导弹,那么,脱靶也就在预料之中了。
从表面上看,有了工程简化I之后,赛博管理的不可管理性就已经解决完了,但事实是“万里长征”才刚刚开始。因为,反馈 w (·)中既含有随机因素,又含有不确定性的因素,所以谁也算不出导弹轨迹 J ( y , w )。于是,无奈之下,还必须再进行一次工程简化,哪怕将有可能扩大误差。
为了说清楚第2次工程简化,我们只考虑一种最简单的情况,即假定管理者系统 J ( y , w )是一维的实数。管理者系统是多维空间的情况,可做类似解释,只是更复杂一些而已,此书就不再赘述了。
包括反馈设备在内的所有实用设备,都有一定的精度。当反馈量小于最低可测精度 a 时,就不会有反馈,于是,系统 J ( y , w )就按既定的方式继续运行,不会被微调,此时我们就将时间压缩,即把迭代的频率降低;否则,就将时间适当拉伸,即把迭代的频率增加,把反馈量切分成碎片,使得:
(1)正值反馈时,只要反馈量一达到 a ,就马上进行微调迭代,并以 J + ( y , a )作为系统输出。
(2)负值反馈时,只要反馈量一达到- a ,也马上进行微调迭代,并以 J - ( y , a )作为系统输出。
然后,将 J + ( y , a )和 J - ( y , a )拼接起来,得到一个新系统,将该新系统记为 J ( y , a );即当反馈为正值时,有
J ( y , a )= J + ( y , a )
而当反馈为负值时,有
J ( y , a )= J - ( y , a )
现进行归纳,便可得到工程简化II。
工程简化II :对某些管理者系统,我们总可以在一定的可接受误差范围内,通过时间的伸缩变换,或降低或增加迭代频率,最终把管理者系统近似为 J ( y ),即消除了随机因素和不可控因素。
关于工程简化II,我们想做以下3点说明:
(1)只要设备足够灵敏,就真的可能用更加频繁的迭代、更加精确的微调、更加及时的反馈来抵消不可控的随机因素。如今,包括汽车自动驾驶等人工智能(AI)技术的成功,就是最有说服力的案例。因为从纯理论角度来看,今天火热的AI和若干年前低谷中的AI相比,其实主要的差别,只是设备的灵敏度提高了,反馈更及时准确了而已。
(2)执行工程简化II时,一定会引出误差。对某些管理者系统 J ( y , w )来说,这种误差是可以容忍的;而对另一些管理者系统 J ( y , w )来说,这样的误差就不能容忍,那么,此时相应的轨迹 J ( y , w )描述也就不得而知了,就只能等待今后相关数学研究取得更大突破后才能处理了。不过,幸好随着设备灵敏度的提高,赛博链将更加精细,工程简化II的误差将越来越小,误差可被容忍的管理者系统会越来越多。
(3)无论是工程简化I还是工程简化II,都一定会引发一定的误差,它们都是没有办法的办法。因为到目前为止,许多理论研究成果还不足以支撑相关需求,所以只好以牺牲精度来换取工程上的可行性了。