扩展式博弈是一种树状结构,其又被称为博弈树,更适用于描述动态博弈。一个扩展式博弈可以表示为 G ={ N , H , E , I , A , U },其中 N 表示参与者集合, H 表示非终止节点(非叶子节点)集合,E表示终止节点(叶子节点)集合, I 表示信息集, A 表示参与者在信息集上的可选策略集合, U 表示效用函数,即参与者在终止节点上的效用。
在扩展式博弈 G 中,第 i 个参与者 p i 的一个行为策略 s i 指的是对于该参与者的每个信息集 I i ∈ I ,为其可选行动 A i ∈ A 分配一个概率分布。那么 S i ∈{ s i }代表该参与者的所有行为策略集合。如果 n 个参与者每人分别从自己的行为策略集合中选择一个行为策略,那么 n 维向量 s =( s 1 ,…, s i ,…, s n )被称为一个策略组合,或将一个策略组合表示为 s =( s i , s -i ),其中 s -i =( s 1 ,…, s i-i , s i+1 ,…, s n )。