松田诚多次出任高中计算机大赛中图灵测试的相关评委。在诸多评委中,他自有一套鉴别屏幕那侧究竟是人还是AI的方法。当然,以高中生的水平自然无法完善出一套可以欺骗人类的AI系统,“人性化”分数只是在各个考察项里汇总出最佳的AI而已。
这次要鉴别的ID是“Hibana”
,而松田也踌躇满志地进入评委席。
在一个隔音的房间里,机器的摄像头在捕捉着松田诚的表情,麦克风则能获取他的声音。而被测者需要根据他的表情和话语在屏幕上输出文字。
“你好。”松田诚说道。
>你好。
屏幕上如此显示。
“你叫什么名字呀?”
>我叫火花,是一个普通的高中生。
自称高中生啊。为了进行盲测,大赛举办方经常会找真正的高中生和大学生混入比赛中。不过由于当初尤金·古斯特曼(Eugene Goostman)的缘故,低于15岁的少年是不会被邀请加入被测人员的。因为这样就能方便AI伪装成不按套路出牌的调皮少年,使得图灵测试难以准确完成,而这正是尤金·古斯特曼在2014年欺骗了三分之一评测人员的制胜法宝。
被测者必须积极配合评委的要求,这是大赛的基本规则。
至少根据现在对方的描述,松田诚还看不出他/她/它是不是AI。既然是图灵测试,就一定要先假定对方是AI,然后诱使对方露出马脚。
“你觉得高中生活如何?”
>感觉还好,就是社团活动挺累的。
“你参加的是什么社团?”
>计算机部。
哦。过去被测试的AI都故意说自己是文化类或者体育类的社团,以避免被轻易怀疑。这家伙很有意思啊。
“计算机部一般都有什么活动呢?”
>为学校制作一些网页,或者和部员们一起做些小游戏。
打字速度忽快忽慢。大概是利用有限范围内的随机数匹配输出时间。
“能让我看看你做的那些网页吗?”
>可以啊。
>我去找一下网址。
过了一会儿,屏幕上发来一个网址。点开网页,一个高中计算机部的页面弹了出来。页面功能中规中矩,美工设计也实属一般。的确是高中生的网页水平。
浏览完网页,松田心想,热身运动已经做完了,是时候准备亮出撒手锏了。
包括松田在内的很多评委都在人类心理学方面有很深的研究。这种寄宿于人类独有的肉体和社会网络而萌发出的复杂机理与诞生自深度学习网络中的AI有着天壤之别,这是评委们进行图灵测试的重点方向。虽然近年来AI在拟人人格方面进展神速,但没有经过实际肉体的成长过程,即使AI可以产生出所谓的“电子人格”,也必然是和人类的人格完全不同的存在。
松田在做图灵测试时很注意对方的人称用法,用“僕”还是“俺”,抑或是“私”
,会不会经常发生更换,以及在对方以某个人格示众时,松田会按照这个人格的某些行为特征提出问题,如果发现不符合的情况,基本就能判断出屏幕的另一侧是AI了(不过,如果在这种情况下对面真是人类,那么这个人有很高概率需要就医了)。
另外就是类比能力,松田会经常用成语和比喻同对方进行交流,这些用语必须是高中水平的人就很容易懂的,这样在和普通人交流时不会存在障碍。但是AI很容易在某些成语和比喻中搞砸,因为不同事物之间的类比非常复杂,而这些类比又暗含了人类的情感因素。不吃透这种纷杂交错的逻辑关系,AI就很容易对人的词汇产生误判,进而给出错得离谱的答案。
“没想到今天是‘神立’(雷阵雨),结果进到‘鮨詰め’(拥挤)的电车里,让人更加郁闷了。”
>的确是这样呢,我也是挤过来的,早高峰的时候在电车里站都站不稳。不过我很喜欢有雷鸣的雨。
“不觉得雷鸣吓人吗?”
>声音在耳边炸响时的确会吓一跳,但闪电的形状很美。就像短暂的沙画一样。
这个类比很有趣。如果对方是AI的话,人性化分数一定会比较高。松田在心里默默想到。
“这里有几道阅读理解的卡片纸,需要你直接回答一下。”
>好的。
松田选出了一张卡片纸,然后摆在摄像头前。
“能看清楚吗?”
>可以。
纸片上用日语写了一段话:“小夜子和耕平即将入睡之时,一楼的起居室突然传来玻璃碎裂的声音。因为不知道发生了什么,两人轻轻走下了楼梯,结果看到三个年轻人在起居室翻箱倒柜。他们害怕被暴力伤害,于是不敢发出声音。”
“这里的‘他们’指的是谁?”松田问道。
>是指小夜子和耕平。
回答得斩钉截铁。后面几道类似的题也是如此。
屏幕前的“Hibana”可能就是个人类吧,松田如此想道。