在搞懂博弈论之前,我们先来看一下什么是“博弈”。“博弈”一词最早出自《论语·阳货》。子曰:“饱食终日,无所用心,难矣哉!不有博弈者乎?为之,犹贤乎已。”意思就是整天吃饱了没事儿干实在是不行的啊。实在没事儿干,掷骰子、下棋也比闲着好啊。朱熹在此作注:博,局戏;弈,围棋也。“局戏”也称“六博”,由于年代久远,其玩法现已失传。关于其最著名的记载是汉景帝刘启用六博的棋盘砸死了吴王太子,成了后来七国之乱的借口。“围棋”至今的变化不大。今天“围棋”已经成为一项高雅活动,但是《论语·阳货》中显示当时对围棋的评价并不高,类似于今天的手机游戏,仅仅是一种消遣活动。
“博弈论”的英文翻译就直观得多,“Game Theory”意思就是“游戏理论”。直观上说,就是教人打游戏。围棋第一手为什么很少有棋手会下在天元?玩《三国杀》的时候,在队友选择了吕布的情况下,自己为什么要选择陈宫?这些都可以用博弈的理论来解释。所以“博弈论”并不是什么高不可攀的理论技术,而是现实生活中大家都经常用到的一些方法。例如,早晨出门,要不要带伞,要不要添衣服;选课的时候要选哪几门课,等等。
当然,博弈论本身的应用很广。往大了说,刘琮为什么要投降曹操,而孙权为什么不能投降曹操?如果抛开背景,这些问题都是如何从多个选项中选择一个选项。那么问题就来了,那么多的选项,到底该选择哪一个?其实,不需要什么理论,因为“趋利避害”是人的本能。看天气预报也好,根据早晨的天空推测也好,如果感觉今天会下雨,那么肯定要拿伞;如果感觉今天不会下雨,那么拿伞还占书包的地方,不拿伞书包就可以多装一袋薯片,那还是不拿伞。如果感觉今天会降温,那就添衣服;如果感觉不会降温,那就不添衣服。理性的人总是选择使自己获益最大的选项。当然,如果多个选项获益相当也是一个很令人头疼的问题,所以很多人都有选择困难症。
博弈论就是把人的选择标准化的理论。需要做选择的自然人或者自然人的群体被称作“参与人”。很明显,参与人不只是自然人。其实,一个国家可以被抽象为一个参与人,一个企业、一支球队也可以被抽象为一个参与人。参与人需要做选择的选项被称为“策略”。每个相关的参与人都做出策略选择后,所有参与人的策略选择就形成了一个策略组合。每种组合都会给所有参与人带来一种结果,而这些结果不一定相同。这种结果被称作参与人的“收益”。这些结果可以按照从参与人最希望得到的到最不希望得到的排列起来,就形成了参与人对不同的结果的偏好。参与人可以根据这些偏好选择自己的策略,所以博弈论就是一套帮助参与人分析预测策略选择的数学模型。所谓模型是指“通过主观意识借助实体或者虚拟表现构成客观阐述形态结构的一种表达目的的物件(物件并不等于物体,不局限于实体与虚拟、不限于平面与立体)”。例如,米开朗基罗的雕像《大卫》展现的“客观”是一个有力的青年男子。但是青年男子首先是个人,是由蛋白质、脂肪和碳水化合物等构成的,而《大卫》是由碳酸钙构成的。所以很明显《大卫》不是一个男子。米开朗基罗将青年男子的特征利用“实体”大理石表现了出来,所以《大卫》就是一个关于男人的大理石模型。那么“数学模型”就是利用“数学工具”表现所需要的“形态结构”的方法。中国著名数学模型专家姜启源对“数学模型”做出的定义是:对一个特定的对象为了一个特定的目标,根据特有的内在规律,做出一些必要的简化假设,得到的由数字、字母或其他数学符号组成的,描述特定对象数量规律的数学公式、算法或图形等。如此,一个复杂的现实问题便可以用数学方法来解决。而数学本身是已经被分析研究了几千年的方法,其自身有一套简洁、严谨和易于推广的特性,便于解决复杂的问题。
构建数学模型的第一步便是构建模型假设,博弈论也不例外。根据上文分析,博弈模型的一个最基本的假设就是参与人的理性。博弈模型中参与人是注重功利的,收益越大,其偏好越高。很明显,偏好是有传递性的。参与人相比a结果,更喜欢b结果;同时相对于b结果,更喜欢c结果。那么参与人相对于a结果,一定更喜欢c结果。如果参与人选择两个策略得到的收益相等,那么这两个策略就是无差别的。如果参与人只有A和B两个策略,策略A为参与人带来的收益是0,策略B为参与人带来的收益是1单位还是100单位,从数学上对于参与人来讲也是无差别的。因为总有A的收益小于B的收益,所以参与人总会选择策略B。当然,以后会讲到在实际应用中,一个策略收益的大小对策略选择还是有影响的。
博弈论的核心在于研究决策过程中各方的行为、决策及这些决策可能带来的结果。它假设每个参与人都是理性的。当然,完全的理性是一个严格的假设。这相当于认为所有的参与人都是极端自私的,在模型中“毫不利人,专门利己”,甚至“损人利己”。从这个角度来看,参与人达到“共赢”的策略选择似乎是不可能的。因为博弈论认为参与人不会选择一个对自己的收益造成损失的策略。这样,每个参与人的决策又会受到其他参与人决策的影响,因此,博弈论研究的是一种相互依赖的决策情境。然而,在现实中还是有人“见义勇为”的。博弈论对这种“非理性”有自己的解释,在非理性行为存在的情况下,参与人是否选择“理性策略”也是一个“理性”的选择。
博弈论不仅假设每个参与人都希望自己的收益最大化,还要假设每个参与人都知道其余参与人都希望自己的收益最大化。不只如此,每个参与人还都知道其余参与人知道自己希望自己的收益最大化。如此便可以大大简化模型,从而能够更容易地分析预测每个参与人的策略选择。而因为博弈模型中的相关知识是每个参与人都知道的,所以每个参与人的预测结果都是相同的。既然所有参与人都能预测到这一结果,那么这一结果肯定会出现。这就是博弈论中的一致性原则。总的来说,博弈论是一种研究决策过程的重要理论和工具,它不仅可以帮助我们理解各种竞争和合作情境下的决策行为,还可以为我们提供有效的决策支持和指导。随着科技的进步和社会的发展,博弈论的应用领域已经十分广泛,其研究方法和工具也在不断更新和完善。