购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

桌游

“西洋十五子棋”比“圈叉游戏”复杂得多,概率和策略均在游戏中起一定作用。这是一种古老的游戏,其变体可以追溯到几千年前,在历史上称为“桌游”。这款游戏的目标是根据抛掷两个骰子的结果在棋盘上移动棋子并最终将棋子从棋盘上拿下(两个骰子的点数分开算,因此掷出6和5后可以移动6个位置和5个位置,而不是一次移动11个位置)。如果对手的棋子是一个“点”(三角玩法位置的名称)上唯一的棋子,那么玩家可以拿下对手的棋子;但是,如果某点上已有对手的两个或更多棋子,那么玩家就不能在那个点上再放棋子。

影响策略的一个因素是抛掷两个骰子的可能结果。如上所述,7是概率最大的总点数(因为它可以由1+6、2+5、3+4、4+3、5+2和6+1组成);表2-1中列出了其他总点数的概率:

表2-1 两个骰子总点数的概率

知道这一点会有用,因为可用的开局一招是将两个骰子的点数应用到同一个棋子上——因此,例如,您可以将一个棋子先移动6个位置,然后再移动5个位置,这样总共移动11个位置,如图2-4所示。尽管这种概率对比赛的结果很重要,但是它的重要性会因受阻点数而改变。游戏策略在很大程度上涉及对这些阻挡的处理,原因有二。首先,因为需要按照每个骰子上的数值单独移动,所以如果向前移动5个位置或向前移动6个位置没有受到阻挡,那么一个棋子只能移动11个位置(沿用上面的例子)。其次,当某玩家有一个或多个棋子被吃掉时,他在将该棋子(或多个棋子)放回棋盘之前不能采取任何其他行动。根据掷骰子的结果,棋子回到棋盘上玩家开始时的那 部位。因此,如果白方的某棋子被吃掉,而黑方挡住了该部位的某(几)点,那么白方就更难回来继续下棋。

图2-4 “西洋十五子棋”开始位置,显示移动方向

“西洋十五子棋”策略的关键方面有多个,其中两个是游戏的开始和结束部分。用任何骰子组合来确定最佳的开局棋步都是可能的。例如,如果掷骰子的结果为5点和6点,那么有两个棋子的某点上的一个棋子应该移动到棋盘的另一端,而两个单独点数的许多组合(例如1和3或2和4)应该用于移动棋盘上被两个位置分开的一对棋子中的每一个棋子,从而挡住另外某点。

同样,当游戏结束时,玩家必须将所有棋子放入棋盘上自己那边的最后 ,然后才能将棋子从棋盘上拿下。通常有两种选择:一种是短距离移动2个棋子,另一种是长距离移动1个棋子。如果2个棋子的移动能让玩家将2个棋子放到最后 ,或者将2个棋子完全从棋盘上拿下,那么这是更好的策略,因为这样可能以更少的步数结束棋局。

虽然看起来很简单,但是“西洋十五子棋”棋盘上有大约10 17 个可能的位置组合,扩大策略范围的因素是游戏中“翻倍”的能力。默认情况下,赢得游戏后,玩家会获得一分(或货币单位)。如果某玩家在另一名玩家将棋盘上任何棋子拿掉之前完成游戏,那么该值将增加到2分(称为“大胜”);如果某玩家完成游戏,而另一名玩家在棋盘上其第一个 部位还有至少一个棋子,那么该值将增加到3分(称为“全胜”)。

不过,在轮到自己时,任何一个玩家均有机会将游戏的数值翻倍。如果另一名玩家接受,那么赢家可以得到的点数翻倍——如果另一名玩家不接受,那么提供双倍点数的玩家立即获胜,获得游戏的当前数值。一旦一个玩家翻倍并得到接受,则只有另一个玩家可以翻倍——该权限在玩家之间来回传递。

翻倍通常被记录在“翻倍骰子”上——骰子的侧面有数字2、4、8、16、32和64。但是,翻倍的规则没有限制,而且可能重复拿掉棋子,重新设定棋子的位置,这意味着原则上游戏有无限的可能状态。(以上对可能位置数量的计算假设只有三种可能的翻倍状态,对应于无人翻倍、白方控制翻倍或黑方控制翻倍。)

与“圈叉游戏”相比,尽管“西洋十五子棋”不是纯粹策略性的,但是它确实可以利用数学概念来增强策略。 isVQ04Bw1IY2XA9dyVF530z/0Nd5lyDtKcJJl2ZK6QrA7H6jcVotIxyXztm+4utV



继续前进

许多现代棋盘游戏始于受“西洋十五子棋”棋盘启发的结构——尽管通常每个玩家只有一个棋子,而棋子在棋盘上可以循环走动。但是,在大多数这样的游戏中,棋盘上的一些或所有位置具有独特的属性。20世纪最著名的棋盘游戏“大富翁”就是如此。虽然它首次设计于1903年(以显示房产所有权的邪恶),但是该游戏到1935年才以人们熟悉的形式商业化推行,当时的版本以新泽西州大西洋城的街道为基础。该游戏的伦敦版于1936年问世,随后在世界各地流传。

与“西洋十五子棋”一样,由于使用两个骰子,因此不同组合出现的不同概率成为游戏策略中的一个因素;不过,正如我们将看到的那样,在“大富翁”游戏中,这些概率最好通过从特定方格的位置逆向推算来使用。

“大富翁”玩家可以购买其落子棋盘上的方格,随后向对手收取在这些方格上落子的费用——当玩家拥有一组匹配的方格时,费用可增加,尤其是如果玩家以在这些方格上建造房产的形式进行投资。在选择建造地点时,可取的做法是考虑对手更有可能建造哪些房产。正如我们看到的那样,用两个骰子掷出的最有可能是7,而从5到9的任何数字均有相对较高的概率出现。

显示不同抛掷结果概率的上表仍然大致正确,但是“大富翁”的分布是有偏向的,因为当掷出双数时,玩家可以再次抛掷。原则上,这种情况可能连续发生2次(如果发生3次,那么玩家就会进监狱),所以玩家在下次轮到时可能被迫落子的地方会明显更多。这也改变概率。也就是说,棋子落在向前8个位置的方格上的可能性高于落在向前6个位置的方格上;而如果一次抛掷两个骰子,那么棋子落在这些方格上的概率相等。这是因为2次掷2个骰子得到8点的方式多于得到6点的方式。但是5点到9点的关键抛掷仍然主导结果。

与“西洋十五子棋”不同,在“大富翁”游戏中,除了使用骰子,还有其他方式可以让棋子在棋盘上移动。一种方式是“机会和公益金”卡(Chance and Community Chest)。其中每一个均有一系列结果——可能涉及赢钱或赔钱。但就策略而言,重要的因素是有可能将玩家移动到特定方格。因此,像火车站、特拉法尔加广场(Trafalgar Square)/伊利诺伊大道(Illinois Avenue)和梅菲尔(Mayfair)/木栈道(Boardwalk)这样的方格是更值得拥有的。

大多数玩家会在某个时候出现在监狱方格上(要么是参观,要么是真的在监狱里)。这是因为有一系列入狱途径,无论是落在“进监狱”方格、获得相关“机会或公益金”卡,还是连续掷出三个双数——所有这些均附加于以通常的方式落在监狱方格上,因此只是参观。这将提高玩家在离开后落在监狱前面5个和9个位置之间方格上的概率——所以这些方格是值得拥有和建造的绝佳房产。因此,监狱后的车站加上橙色方格比许多其他地点更有吸引力,而洋红色方格(除了第一个)和红色方格的吸引力也得到提升。

还有策略上的其他微妙之处可以通过测算建造房屋的投资回报概率来评估(一次性建造三座房屋是最高效的方法)。可以肯定的是,博弈论在“大富翁”游戏中的好处远多于初步设想。 qtYfOdzLx7fQK25srbBIrNRFMjtdT81UbKw42EHL8FiQShPssQYlgSJ4GzxLGE3C



围棋

在策略复杂的一些游戏中,人们试图将这种策略编码成计算机程序;最早的此类棋盘游戏是国际象棋,但实践证明更难攻克的是围棋。在看似简单的围棋游戏中,棋手轮流将白色或黑色的棋子放在矩形格子的交叉点上,迫使这些棋子完全包围的对手棋子——概率组合性爆炸。

例如,在国际象棋中,白方棋手有20个初始走法可供选择(兵的16个棋步,马的4个棋步);每一种“开局走法”均经过详细分析。而标准的围棋棋盘有361个交叉点可供棋手开始走棋,另外几步内的走法数量螺旋式攀升。据估计,围棋大约有10 170 种可能的走法,而国际象棋大约有10 50 种可能的走法。 [1]

有一些已知的游戏策略可以立即规划出击败随机放置棋子的新手的路线。这些策略通常涉及保持棋手自己的棋子连接,同时试图切断对手的棋子——因此,角成为特别有吸引力的起点。然而,基于游戏理论开发能下围棋的计算机程序的早期尝试却以失败告终。围棋形式简单,但组合极其复杂,因此,需要另辟蹊径。当最终开发出经证明能够击败冠军的AlphaGo软件程序时,采用的是摒弃传统策略开发的方法论。

AlphaGo利用神经网络——在一定程度上模拟大脑部分结构的计算机结构,机制是AlphaGo可以在不知道它在做什么的情况下做出决定,更不用说知道可用的策略了。事实上,打败世界冠军的第一个AlphaGo版本结合了人类专家的训练和自我学习——因此涉及了策略。不过,2017年,该团队开发了新版本,并在《自然》( Nature )期刊上发表:

在本文中,我们介绍完全基于强化学习而不需要人类数据、指导或者游戏规则领域知识的一种算法。AlphaGo成为自己的老师:将神经网络训练得可以预测AlphaGo自己的棋步选择……从一张白纸开始,我们的新程序AlphaGo Zero实现了超人的表现,以100:0击败了之前发布的、击败冠军的AlphaGo。

确实,这个版本需要遵循的只是游戏规则,没有策略概念。在与自己对弈近500万次(初期随机走棋)之后,AlphaGo Zero超越了以往可能的表现。在强化学习中,不是告诉软件要做什么——在根据从当前位置获胜的估计概率判断进展顺利时,它就会获得奖励。这导致AlphaGo Zero的棋步选择往往是围棋专家认为毫无意义的决定——事实上,它的部分优势就在于它的棋法会出人意料。

从某种意义上说,AlphaGo确实运用策略——但它没有运用任何理论来制订这些策略,也没有关于为什么运用特定策略的任何理解。这一切都归结于试错学习——AlphaGo对博弈论一无所知。

这种方法的成功指出博弈论的一个局限。围棋根本不是可以用理论来合理解释的游戏,因为它有太多可能的走法和对应走法,这导致用博弈论来下围棋的行为类似于测算一盒气体中分子的物理行为。虽然原则上我们可以算出每个气体分子的牛顿行为(暂时抛开量子物理学的古怪之处),但是,任何合理大小的盒子中的万亿个分子的牛顿行为实际上无法计算出来,而是需要使用统计方法进行统计。 qtYfOdzLx7fQK25srbBIrNRFMjtdT81UbKw42EHL8FiQShPssQYlgSJ4GzxLGE3C

点击中间区域
呼出菜单
上一章
目录
下一章
×