博弈论提供了描述和解决博弈问题的数学工具。通常,博弈通过以下参数来描述:博弈参与者、参与者行动次序、参与者可能的行为、每个参与者在行动前关于其他参与者行为的知识,以及每个参与者关于其他参与者效用函数的知识。博弈论假定每个参与者都是理性的,参与者在响应其他参与者行为时,会选择给其带来最大收益或效用的响应。博弈论研究两个或两个以上参与者之间的交互过程,如果参与者之间完全是竞争关系,称为非合作博弈;如果参与者之间是合作关系,称为合作博弈。博弈论主要有以下4个基本概念。
(1)参与者:博弈中的参与实体,可以是人、机构、动物以及其他任何交互的物体。
(2)行为:参与者在每次行动中都展现出的具体行为,博弈论假定每个参与者知道其他参与者可能的行为。
(3)效用:博弈参与者都做出相应决策后,每个参与者都将获得一个正或负的回馈,即参与者的效用。
(4)策略:参与者的策略是该参与者的行为计划,指定了参与者根据其历史行为将如何行动;策略可分为纯策略和混合策略。
博弈的解即博弈的纳什均衡(Nash Equilibrium),它是理性参与者根据其他参与者的行为策略选择能够最大化其效用的策略时导出的。博弈的纳什均衡是一组参与者的策略组合,使每个参与者的策略都是关于其他参与者策略的最优响应,即该策略能够在其他参与者策略给定的情况下所能导出的最大效用。
博弈主要有以下3种分类方法。
(1)根据博弈是否为多阶段,其可分为静态博弈和动态博弈。静态博弈是单阶段博弈,博弈参与者同时行动;动态博弈是多阶段博弈,阶段的次数可以是有限或无限的。概率博弈是一种动态博弈,从开始阶段向下一个阶段转移,每次阶段转移都有相应的转移概率,阶段转移后每个参与者可根据其他参与者的状态转移概率和行为计算出它获得的效用。
(2)根据博弈是否拥有完美信息,其可分为完美信息博弈和不完美信息博弈。在完美信息博弈中,每个参与者在采取行动之前都知道其他参与者先前的行为,如围棋博弈。在不完美信息博弈中,至少有一个参与者在行动前不知道其他参与者先前的行为。
(3)根据博弈是否拥有完全信息,其可分为完全信息博弈和不完全信息博弈。在完全信息博弈中,每个参与者都知道其他参与者的效用函数,如囚徒困境博弈。在不完全信息博弈中,至少有一个参与者不知道其他参与者的效用函数。贝叶斯博弈是典型的不完全信息博弈,每个参与者被分配一个类型,类型用于捕获该参与者的不完全信息。每个参与者知道其他参与者的效用函数结构,但不知道其他参与者具体的类型值,只知道有多个可能的类型值,如拍卖博弈。