购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第2节
黑客的最佳攻击战略

由于政治黑客后台很硬,不计成本,不择手段,耐得住寂寞,因此,从纯技术角度看,政治黑客是最牛的黑客,他们的攻击力远远超过经济黑客等普通黑客。

为了量化分析(因为政治问题无法量化),上一节不得不用“宰牛刀”来“杀鸡”(即用政治黑客的技术来为经济黑客的利益服务),给出了最牛黑客的完整静态描述,并且还给出了他们的最佳组合攻击战术。但是,并不是所有黑客都能够达到如此高的技术极限,甚至这样的黑客也许只存在于理论中,可望而不可即。

幸好,经济黑客的主要目标是获取最大的黑产收入,而不是要伤害被攻击系统(政治黑客刚好相反,他的目标是伤害对方,而非获得经济利益,虽然最根本的目标还是经济),当然,经济黑客也不会有意去保护对手。所以,经济黑客的技术水平虽然有限,但他们可以依据已有的技术水平,像田忌赛马那样,通过巧妙的组合攻击来尽可能实现收益最大化。

黑客攻击和炒股其实很相像。实际上,政治黑客的攻击就像庄家炒股,虽然他对被攻击系统(待炒的股票)的内部情况了如指掌,但他的期望值也很高,不出手则已,一出手就要摧毁目标(赚大钱)。因此,一旦行动起来,其战术就非常重要,不能有任何细节上的失误,否则前功尽弃。事实证明,庄家炒股也有赔钱的时候,同样,政治黑客的攻击也有失手的时候。其主要失败原因基本上都是输在战术细节上。

经济黑客的攻击就像散户炒股,虽然整体上处于被动地位,资金实力也很差,但自身的期望值并不很高,只要有钱赚,哪怕刚够喝稀饭。经济黑客的攻击(散户的炒股)当然不能靠硬拼,必须讲究战略。比如:①正确选择被攻击系统(待炒的股票),目标选错了当然要赔本;②合理分配精力去攻击所选系统(炒作所选股票),既不要“在一棵树上吊死”也不能“小猫钓鱼”(既不要把资金全部投到某一只股票,也不要到处“撒胡椒粉”)。事实证明,散户炒股也有赢钱的时候,只要他很好地运用了相关战略(即选股选对了,在每只股票上的投资额度分配对了)。同样,经济黑客也有可能获利,如果他正确地把握了相关战略。本节将给出一些确保黑客获利的对数最优战略,这只需要普通的信息论知识(见参考文献[5]或本书第7章中的第3节)就能读懂。

过去若干年,人们已经在投资策略(包括炒股)方面进行了大量研究,并由此丰富了博弈论的内容。本节的许多思想、方法和结果也是来源于这些理论。

首先,来看黑客的一种对数最优攻击组合。

设黑客想通过攻击某 m 个系统来获取其经济利益,并且根据过去的经验,他攻击第 i 个系统的投入产出比是随机变量 X i X i ≥0, i =1,2,…, m ),即攻击第 i 个系统时,若投入1元钱,则其收益是 X i 元钱。记收益列向量X=( X 1 , X 2 ,…, X m ) T 服从联合分布 F ( x ),即 X F ( x )。

从经济角度看,所谓黑客的一个攻击组合,就是这样一个列向量

它意指该黑客将其用于攻击的资金总额的 b i 部分花费在攻击第 i 个系统上( i =1,2,…, m )。于是,在此组合攻击下,黑客的收益便等于

这个 S 显然也是一个随机变量。

当本轮组合攻击完成后,黑客还可以发动第2轮、第3轮等组合攻击,即黑客将其上一轮结束时所得到的全部收益按相同比例 b 分配,形成新一轮的攻击组合 b 。下面,我们将努力寻找最佳的攻击组合 b ,使得经过 n 轮组合攻击后,黑客的收益 S 在某种意义上达到最大值。

定义3.2:攻击组合 b 关于收益分布 F ( x )的增长率,定义为:

如果该对数的底数是2,那么该增长率 W ( b , F )就是上一节中的双倍率(见定义3.1)。攻击组合 b 的最优增长率 W * ( F )定义为

这里的最大值取遍所有可能的攻击组合

如果某个攻击组合 b * 使得增长率 W ( b , F )达到最大值,那么这个攻击组合就称为对数最优攻击组合。

为了简化上角标,本节对 b * b (*)、 W * W (*)交替使用,不加区别。

定理3.5:设 Χ 1 , Χ 2 ,…, Χ n 是服从同一分布 F ( x )的独立同分布随机序列。令

是在同一攻击组合 b * 之下, n 轮攻击之后黑客的收益,那么

证明:由强大数定律可知

所以, 。证毕。

引理3.1: W ( b , F )关于 b 是凹函数,关于 F 是线性的,而 W * ( F )关于 F 是凸函数。

证明:增长率公式为

由于积分关于 F 是线性的,所以 W ( b , F )关于 F 是线性的。又由于对数函数的凸性,可知

对该公式两边同取数学期望,便推出 W ( b , F )关于 b 是凹函数。最后,为证明 W * ( F )关于 F 是凸函数,我们假设 F 1 F 2 是收益列向量的两个分布,并令 b * ( F 1 )和 b * ( F 2 )分别是对应于两个分布的最优攻击组合。令 b * [ λF 1 +(1- λ ) F 2 ]为对应于 λF 1 +(1- λ ) F 2 的对数最优攻击组合,那么利用 W ( b , F )关于 F 的线性,有

因为 b * ( F 1 )和 b * ( F 2 )分别使得 W ( b , F 1 )和 W ( b , F 2 )达到最大值。证毕。

引理3.2:关于某个分布的全体对数最优攻击组合构成的集合是凸集。

证明:令 是两个对数最优攻击组合,即

W ( b , F )的凹性,可以推出

也就是说, λb 1 +(1- λ ) b 2 还是一个对数最优的攻击组合。证毕。

表示所有允许的攻击组合。

定理3.6:设黑客欲攻击的 m 个系统的收益列向量 X =( X 1 , X 2 ,…, X m ) T 服从联合分布 F ( x ),即 X F ( x )。那么,该黑客的攻击组合 b * 是对数最优(即使得增长率 W ( b , F )达到最大值的攻击组合)的充分必要条件是

证明:由于增长率 W ( b )= E [log( b T X )]是 b 的凹函数,其中 b 的取值范围为所有攻击组合形成的单纯形。于是, b * 是对数最优的当且仅当 W (·)沿着从 b * 到任意其他攻击组合 b 方向上的方向导数是非正的。于是,对于

可得

由于 W ( b λ )在 λ =0+处的单边导数为

这里, λ →0表示从正数方向,越来越趋于0。于是,对所有 b В ,都有

如果从 b b * 的线段可以朝着 b * 在单纯形 В 中延伸,那么 W ( b λ )在 λ =0点具有双边导数且导数为0,于是 ;否则, <1。(注:此定理的更详细证明可见参考文献[5]中定理16.2.1的证明过程。)证毕。

由定理3.6,可以得出如下定理。

定理3.7:设 S * = b *T X 是对应于对数最优攻击组合 b * 的黑客收益,令 S = b T X 是对应于任意攻击组合 b 的随机收益,那么,对所有 S ,当且仅当对所有的 S

证明:对于对数最优的攻击组合 b * ,由定理3.6可知,对任意 i

对此式两边同乘 b i ,并且关于 i 求和,可得到

这等价于

其逆运算可由Jensen不等式得出,因为

证毕。

定理3.7表明,对数最优攻击组合不但能够使得增长率最大化,而且也能使得每轮攻击的收益比值 最大化。

另外,定理3.7还揭示了一个事实:如果采用对数最优的攻击组合策略,那么对于每个系统的攻击投入,所获得的收益比例的期望值不会在此轮攻击结束后而变化。具体地说,假如初始的攻击资金分配比例为 b * ,那么第一轮攻击后,第 i 个系统的收益与整合攻击组合的收益的比例为 ,其期望为

因此,第 i 个系统在本轮攻击结束后的收益,占整个攻击组合收益的比例的数学期望值,与本轮攻击开始时第 i 个系统的攻击投入比例相同。因此,一旦选定按比例进行攻击组合,那么在随后的各轮攻击中,在期望值的意义下,该攻击组合比例将保持不变。

现在深入分析定理3.5中 n 轮攻击后黑客的收益情况。令

为最大增长率,并用 b * 表示达到最大增长率的攻击组合。

定义3.3:一个因果的攻击组合策略定义为一列映射 b i :R m(i-1) В ,其中 b i ( x 1 , x 2 ,…, x i-1 )解释为第 i 轮攻击的攻击组合策略。

W * 的定义可以直接得出:对数最优攻击组合使得最终收益的数学期望值达到最大。

引理3.3:设 为定理3.5所述,在对数最优攻击组合 b * 之下, n 轮攻击后黑客的收益。又设 S n 为采用定义3.3中的因果攻击组合策略 b i n 轮攻击后黑客的收益。那么 E (log )= nW * E (log S n )。

证明:

此处,第一项和第二项中的最大值(max)是对 b 1 , b 2 ,…, b n 而取的;第三项中的最大值(max)是对 b i ( X 1 , X 2 ,…, X i -1 )而取的。可见,最大值恰好是在恒定的攻击组合 b * 之下达到的。证毕。

到此,我们就知道:由定理3.6中的 b * 给出的攻击组合能够使得黑客收益的期望值达到最大值,而且所得的收益 S n * 以高概率在一阶指数下等于2 nW(*) 。其实,我们还可以得到如下更强的结论。

定理3.8:设 和S n 如引理3.3所述,那么依概率1有

证明:由定理3.6可推出 ,从而由马尔可夫不等式得到

因此,

t n =n 2 ,并对所有 n 求和,得到

利用Borel-Cantelli引理,我们有

这意味着,对于被攻击的每个系统向量序列都存在 N ,使得当 n > N 时, 均成立。于是,依概率1有

证毕。

该定理表明,在一阶指数意义下,对数最优攻击组合的表现相当好。

散户炒股都有这样的经验:如果能够搞到某些内部消息(学术上称为“边信息”),那么炒股赚钱的可能性就会大增。但是,到底能够增加多少呢?下面就来回答这个问题。当然,我们将其叙述为:边信息对黑客收益的可能影响。

定理3.9:设 X 服从分布 f ( x ),而 b f 为对应于 f ( x )的对数最优攻击组合。设 b g 为对应于另一个密度函数 g ( x )的对数最优攻击组合。那么,采用 b f 替代 b g 所带来的增长率的增量满足不等式

这里, D ( f g )表示相对熵(见参考文献[5]或本书第7章中的第3节)。

证明:

证毕。

定理3.10:由边信息 Y 所带来的增长率的增量Δ W 满足不等式

这里, I ( X ; Y )表示随机变量 X Y 之间的互信息。

证明:设( X , Y )服从分布 f ( x , y ),其中 X 是被攻击系统的投入产出比向量,而 Y 是相应的边信息。当已知边信息 Y = y 时,黑客采用关于条件分布 f ( x Y = y )的对数最优攻击组合,从而在给定条件 Y = y 下,利用定理3.9,可得

Y 的所有可能取值进行平均,得到

从而,边信息 Y 与被攻击的系统向量序列 X 之间的互信息 I ( X ; Y )是增长率的增量的上界。证毕。

定理3.10形象地告诉我们,内部消息能够使黑客的黑产收益增长率的精确上限不会超过 I ( X ; Y )。

下面再考虑被攻击系统依时间而变化的情况。

X 1 , X 2 ,…, X n 为向量值随机过程,即 X i 为第 i 时刻被攻击系统向量,或者说

其中, X ji ≥0是第 i 时刻攻击第 j 个系统时的投入产出比。下面的攻击策略是以因果方式依赖于过去的历史数据,即 b i 可以依赖于 X 1 , X 2 ,…, X i-1

黑客的目标显然就是要使整体黑产收入达到最大化,即让ElogS n 在所有因果组合攻击策略集{ b i (·)}上达到最大值。而此时有

其中, 是在已知过去黑产收入的历史数据下, X i 的条件分布的对数最优攻击组合,换言之,如果记条件最大值为

b * i ( x 1 , x 2 ,…, x i-1 )就是达到上述条件最大值的攻击组合。关于过去期望值,我们记

并称之为条件增长率。这里的最大值函数是取遍所有定义在 X 1 , X 2 ,…, X i-1 上的攻击组合 b 的攻击组合价值函数。于是,如果在每一阶段中,均采取条件对数最优的攻击组合策略,那么黑客的最高期望对数回报率(投入产出率)是可以实现的。

其中,最大值取自所有因果攻击组合策略。此时,由

可以得到以下关于 W * 的链式法则:

该链式法则在形式上与熵函数 H 的链式法则完全一样(见参考文献[5]或本书第7章第3节)。确实,在某些方面 W H 互为对偶,特别地,条件作用使 H 减小,而使 W 增长。换句话说,熵 H 越小的黑客攻击策略,所获得的黑产收入越大!

定义3.4(随机过程的熵率):如果存在以下极限那么,就称该极限 W * 为增长率。

定理3.11:如果黑客“投入产出比”形成的随机过程 X 1 , X 2 ,…, X n 为平稳随机过程,那么黑客的最优攻击增长率存在,并且等于

证明:由随机过程的平稳性可知, W * ( X n X 1 , X 2 ,…, X n-1 )关于 n 是非减函数,从而其极限是必然存在的,但有可能是无穷大。由于

故根据Cesaro均值定理(见参考文献[5]中的定理4.2.3),可以推出上式左边的极限值等于右边通项的极限值。因此, 存在,并且

证毕。

在平稳随机过程的情况下,还有如下的渐近最优特性。

定理3.12:对任意随机过程{ X i }, X i ( X i-1 )为条件对数最优的攻击组合,而 为对应的相对黑产收益。令 S n 为对应某个因果攻击组合策略 b i ( X i-1 )的相对收益,那么关于由过去的 X 1 , X 2 ,…, X n 生成的 σ 代数序列,比值 是一个正上鞅。从而,存在一个随机变量 V 使得

证明: 为正上鞅是因为使用关于条件对数最优攻击组合(定理3.6),可得

于是,利用鞅收敛定理(见参考文献[5]),得知 的极限存在,记为 V ,那么

最后,利用关于正鞅的科尔莫戈罗夫不等式,便得到关于 的结果。证毕。 a0g3xavfpgsbY4l1iM04fSenSJxmnQuHOuptjZYbSEDSytWtH8vLIRiaOb5E/veD

点击中间区域
呼出菜单
上一章
目录
下一章
×