购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

精妙绝伦

多年来,我一直把数学研究与下围棋做比较。所以,我怀着相当焦虑的心情在YouTube上观看了李世石与AlphaGo的比赛。这场“人机大战”吸引了全球超过2.8亿人次在线观看。

李世石执黑先行,作为白方的DeepMind团队由其成员黄士杰(Aja Huang)代替AlphaGo行棋。这样安排是因为,毕竟AlphaGo只是人工智能程序而不是能够自己下棋的机器人。黄士杰紧紧盯着AlphaGo的屏幕,等待它对李世石的落子做出回应,但时间过了一小会儿,AlphaGo没有任何反应。

我聚精会神地盯着屏幕,想知道AlphaGo是不是已经崩溃了!DeepMind团队也开始担心,想知道这是怎么了。对于人类棋手来说,刚开局的几步棋通常都是标准布局套路,是不会想太多的,毕竟还没有进入真正的交锋时刻。在焦急的等待过后,电脑屏幕上出现了一颗白子,AlphaGo终于开始走棋了。直至此时,DeepMind团队才算是松了一口气,心口的大石终于落了地:它可以自行工作了,没我们什么事了!在接下来的时间里,黑白双方你来我往,好不快意。

作为围棋外行的我在观看围棋比赛时会关注一个问题,就是如何判断胜负手,这是围棋比赛的要点之一。这也正是计算机程序学习下围棋非常困难的主要原因之一,因为到目前为止,还没有一种简单易行的方法可以建立起一套稳妥的系统,去评价对弈双方的领先状况。

相较之下,国际象棋更容易进行得分评价,它的比赛规则确定了每一步都会有不同的分值,这样你就可以简单地算出双方的领先状况。国际象棋是破坏性的,在行棋过程中,棋子会被一个个吃掉。正因为如此,棋局会逐步简化。而围棋则不然,它是建设性的,行棋越多,棋盘上的棋子越多,棋局也越来越复杂。现场解说员虽然一直关注着棋局,但不到最后一刻他们也很难断言谁胜谁负,鹿死谁手。

研究团队很快摸清了李世石的开局策略。李世石采用的对战策略是,如果AlphaGo是通过对过去的棋局进行学习来完善自身的,那么他就使用非传统的棋路来打乱AlphaGo的预判,这样就会使他获得一定的优势。但问题是,在这种情况下,李世石也只能按照自己不熟悉的棋路去行棋、布局。对于一般的基于开放式数据库的程序来说,不按套路出牌的策略非常管用:不仅可以使机器手足无措,还可能误导机器在棋局的重要关口或是长远战略决策上犯下致命错误。但遇到AlphaGo,这个如意算盘可就打空了,因为AlphaGo可以实时动态评估棋局形势,并根据以前的经验制定出最佳策略。AlphaGo的首席程序员大卫·西尔弗(David Silver)在赛前表示:“AlphaGo可以自动把数以百万计的棋局数据通过神经网络进行深度学习并加以改进,以得到最佳的对弈策略。相比之下,李世石则由于无法掌控自己的棋局而会变得越发被动。”

看到这里,我不禁同情起李世石来。当他意识到自己一直处于被动时,你能真切地感觉到他的信心正在逐渐丧失。他一直盯着代替AlphaGo行棋的黄士杰,但却从对方的脸上看不到任何线索。当下到第186手时,李世石感到大势已去,便投子认输了。

五番棋首局后,AlphaGo以1:0暂时领先。李世石在当天的新闻发布会上表示:“我很惊讶,我从未料想到自己会输给AlphaGo。”

第二局才是好戏一场,不仅仅让参赛的李世石瞠目结舌,还让观看比赛的棋手们感到匪夷所思。第一局比赛中AlphaGo所走的每一步棋还是符合人类逻辑思维的,现场的专家也能够讲解和分析棋局。但到了第二局,“事出反常必有妖”,当李世石下完第36手来到酒店屋顶抽烟休息时,AlphaGo下出第37手:黄士杰在距离棋盘边缘5步的位置落下一颗黑子。这一招使得包括李世石在内的所有人都倍感震惊。

根据传统的行棋套路,在初始阶段,应先在最外面的4条线上落子,这样就可以在棋盘边缘向内的第3条线上形成短效的区域控制力量,而在第4条线上落子则可以帮助棋手在棋局的后期向中心扩张自己的势力范围。所以,棋手们一般会选择先在第3条线或第4条线上落子,以达到一种较好的攻守平衡。在第5条线上落子一般被认为是不太恰当的选择,因为这会给对手可乘之机:建立一个既可在短效、局部区域内抢得先手,又可在长远、全局范围内影响胜负的策略。

此步棋打破了长久以来的传统观念,有评论员抨击这种下法明显是胡闹,但也有一些评论员持谨慎态度。大家都很期待看到李世石的应对策略。当李世石重返赛场看到此棋时,他在盒中取子的身体在往后缩……他举棋不定,坐在那里思考了超过12分钟。围棋和国际象棋同样都限定了落子的时间,用12分钟来思考一步棋的代价很大。李世石花费了如此之久的时间才落子,也从侧面说明了AlphaGo的这步棋是多么的出人意料。他弄不明白AlphaGo到底想要干什么:为什么程序主动放弃了它正在“争夺”的区域?

难道是AlphaGo出现了错误?还是它发现了棋局中被李世石忽视的某些东西?当担任裁判的樊麾看到这步棋时,他最初的反应与其他人一样,除了惊讶就是惊讶。但是,他很快意识到了,这确实不是人类的行棋方法,他从未见过有人会这样行棋。他不禁感叹:“这步棋真是神来之笔,精彩绝伦!”接下来的比赛证明,这一步既精彩又致命:这一着非但不是臭棋,反而是立意深远的妙手。大约又过了50子,黑白双方开始在棋盘的左下角争夺地盘,棋路向AlphaGo第37手时落下的那颗黑子靠近。正是由于AlphaGo的这一预先布局,让黑方在这一片区域赢得了优势。正是这制胜的一子,让AlphaGo以2:0继续领先于人类。

在当日赛后的新闻发布会上,李世石的情绪明显不同于前日:“昨天的我很惊讶,但今天的我无言以对,心中满是震惊。坦白地说,第三场比赛对我来说将不是那么容易了。”大家都很清楚,这场人机对弈共有五局,从第三局开始李世石必须全胜才有可能逆转战局、反败为胜。 sHLhZtdzYPSVB0mat87bmD/Jqi7MWN8wPu1V7o4b9b1B0dN1WIJTHSiwcHvkN0Xg

点击中间区域
呼出菜单
上一章
目录
下一章
×