语言文明与社会治理最新章节_方小兵著

二、机器如何获得语境能力

人工智能学者、自然语言处理工程师以及其他一些人士，在近期取得“机器学习”和“深度学习”的技术性突破之后，大有“志在必得”，制造可以取代人类说话的机器人之意。如上所述，如果需要管制人工智能的发展，是否应该防止达到人类语言能力的机器人的产生呢？目前似乎还没有这方面的呼声。但是，智能机器取代一些需要语言技能的工作岗位的事情已经发生，许多职业和行业因此受到影响和冲击。然而，学界和社会总体上还是欢迎人工智能的发展。因为，迄今为止，进入应用的人工智能仍然是“弱人工智能”，它提供的一般是对人类活动的辅助性功能，所取代的往往是比较简单的重复性劳动，还不能全面取代高端认知功能的脑力劳动。例如，关于“机器翻译”是否取代“人工翻译”的讨论，其结果仍然是：机器翻译目前不能全面取代人工翻译，但是已经成为人工翻译的重要辅助工具。

事实上，机器翻译在特定的应用上已经超越了人工翻译。但是，这些应用的共同特点是，它面对的是一个基本封闭的系统；而且，系统越是封闭，它的效率和准确性就越高，越能显现其面对人工的优势。然而，人类语言从本质上看，是一个开放系统。而且，语言是不断发展变化的，语言使用者需要不断地学习语言才能够有效地使用语言。笔者曾经撰文指出语言学理论在不同阶段对自然语言处理技术发展的影响（徐大明，2017）。该文指出，结构主义语言学基本上把语言描绘成一个封闭的系统；生成语言学进一步推进，认为语言系统的封闭性可以归结到人类大脑的特定机制。这些语言学理论的发展，直接或间接地推动和引导了人工智能的发展，特别是计算机自然语言处理的发展。最初的自然语言处理的成功案例即是在有限规则和有限词汇的条件下的应用。结构主义语言学的鼻祖索绪尔曾经将语言结构系统比喻成棋类的规则系统。值得注意的是，棋类规则系统是一个固定不变的有限系统。因此，虽然阿尔法狗打败了世界顶级棋手李世石，但是目前最先进的机器人的语言能力还未能达到一个最平庸的成年说话人的能力；这恐怕就是人工智能驱动的自然语言处理还受制于有限规则模式的原因。然而，“机器学习”似乎可以扭转这一局面；因为它不再应用一套固定的规则，而是根据所处理的语料不断生成和改进其语言处理模型。

人类语言不但具有系统开放性，还具有可习得性。人工智能开始模仿人类语言的习得机制，可谓一个重要的进步，恐怕也是受到了20世纪后半叶以来语言学者关注人类语言习得能力的研究的一些影响。然而，语言学主流目前仍然忽视的一个语言的本质性特征，却也受到了人工智能自然语言处理学界的忽视，这就是语言的社区性（徐大明，2017）。

语言学家在追求语言共性的时候忽略了对语言多样性的解释。对于语言共性所包括的内容迄今还有争论，但是无可置疑的是，语言的多样性是一个显而易见而又不可磨灭的事实。为什么人类的语言具有多样性，而不实现为一个单一的语法语义系统呢？我们的解释就是，语言多样性来源于语言的社区性。任何自然语言，都是言语社区的产物。（徐大明，2004）不同的语言在不同的言语社区中孕育发展、使用和传承，所以才有语言的多样性。假如有朝一日，人类社会不再由众多不同的社区组成，或者至少从言语交流方面不再有社区的界限了呢？如果这一天到来，人类语言的多样性必然会与当前的多样性大不相同。但是，语言多样性不会消失，只会转变其表现形式。这是因为，语言的社区性，来源于一个更基础性的特性：语言应用的语境性。换言之，语言的社区性只是语言的语境特性的一个层次。语言作为一个交际工具，一个信息传递方式，其运作机制必不可少地包含语境的成分。然而，语境是多层次的。当前的语言多样性强调的是民族语言多样性。然而，语言多样性的内涵远远不止民族语言多样性。

语言，究其本质来讲，是人类的信息工具（徐大明，2014）。人类社会的产生，早于人类语言的产生；从这个角度看，也许人类社会不一定需要语言。但是，人类的文明史却离不开语言文字的发展和应用；脱离了语言文字，现代社会恐怕就要解体。既然人类已经走上使用有声语言这条进化之路，既然人类社会已经构筑在语言文字的基础之上，恐怕我们还是要先考虑怎样在当前的路上前进，怎样在当前的基础上建设的问题。人类语言的沟通功能帮助人类组织合作，构筑社会。人类语言的隔绝功能又局限了人群合作的规模和层次。迄今人类社会难以完全共享信息，难以取得共识和全面合作，是否就是因为人类对语言这一信息工具的依赖呢？人类语言是否可以加以改造，增强其沟通功能，降低以至消除其隔绝功能呢？换言之，人类的理想世界，是不是就包括“语同音”的“世界大同”呢？

一旦有了需要，就有了创新和发展。在复杂的大规模的人类社会组织形成之际，即产生了许多不同的克服言语交际障碍的方法和措施。迄今为止，比较行之有效的方法有语言学习、语言规范和语言翻译。语言学习可以是自发的、个别的现象，也可以是有组织的、社会化的现象。语言规范可以是在社区交际中约定俗成的产物，但在现代社会中往往变成通过权威机构实施的强制性措施。语言翻译在现代社会中已经成为一项职业，一个行业，一项产业。目前的人工智能可以辅助语言学习，也可以辅助语言规范的实施，还可以辅助语言翻译，悬而未决的问题是，它可否完全取代人工翻译？

如上所述，语言规范是支撑大规模社会组织的一项措施。实际上它所体现的就是言语社区的功能。所谓言语社区，就是一群遵循相同规范进行交际的说话人（Gumperz，1965；徐大明，2004；Xu，2015）。言语社区的形成就是言语交际规范的形成。从广义上来讲，语言作为一个音义符号系统，也不过是言语交际规范的一部分。人类进入现代社会之后，自然形成的言语社区被机构化和政治化，国家机器的语言规划调整或重建言语社区，语言学因此产生应用语言学这一分支。为了克服语言障碍，人类近几百年的努力可以基本归纳为两类：一类是通过提升个体的语言学习能力，通过双语人来沟通和联结不同的言语社区；另一类是在大范围内推广特定的语言规范，建设大规模言语社区。近几十年来，人工智能开始助力语言事业，成为自文字产生以来又一次的语言技术的飞跃。

计算机对自然语言的处理，即使是在“机器学习”之前的阶段，就已经取得了十分重要的成果。自然语言处理，曾经经历了“基于规则”和“基于概率”的技术发展阶段。基于规则的算法的局限性，很大程度上应归咎于语言学的局限。从本质上来说，不是语言没有规律，言语交际没有规则，而是这些规律和规则太复杂，语言学家还没有把它搞清楚，并且没有把面向言语交际的语言规律作为语言学的主要研究对象。然而，自然语言处理要达到的目标则是完成言语交际的任务。“语言是一个规则系统”的说法是一个抽象，也是一个理想。而在言语交际的现实中，语言规则的实现一般都是概率性的事件，任何一项规则的绝对化处理都可能导致应用的失败。因此基于概率的算法提高了自然语言处理的正确率。机器有机器的优势，但是在面对人类语言的时候，需要了解人类到底有何优势。语料库语言学、神经语言学为人工智能提供了重要的启示。目前的“机器学习”不但大量地处理语言材料，从中“习得”语言的规律，而且“神经网络”“无监督学习”等先进技术的应用，正在不断逼近人类语言习得的结果。由于其超越人类个体极限的处理大数据的能力，计算机在许多方面超越了人类的语言学习效果。

看来我们可以预测，人工智能很快可以智慧地处理人类语言了。目前科技人员的一项努力是将“百科知识”装备于机器人，使它造出符合事理的句子，并结合这些知识来理解文本语义。那么它还缺什么呢？实际上，它缺的是语境理解能力和语境建构能力。目前的语言计算模型中还暂时缺乏有关的内容，因为语境超出了“语言”的范围，尽管它是语言使用中不可缺乏的部分。计算机处理再多的语料，应用再先进的算法，也只能从语料中获得信息。然而，语言交际实际上是语言和语境的结合。其中所传递的信息，不仅包含话语本身的信息，还包含着接受话语者对话语发出者的理解及其意图的预设。而且这还是一个动态过程，在会话交际过程中，会话双方在不断地验证和修正自己对对方会话意图的理解（Gumperz，1982）。即使是在阅读这一看来似乎单向的语言交际模式中，读者也是在积极地思考，在猜测和验证字里行间的意思。因此，计算机对于书面文本的理解将首先实现，而面对活人的会话能力将受到动态的会话意图的不确定性的局限。

仅仅通过文本语料来学习语言是不够的。语言信息的传达百分之百是依赖语境的。当然这里说的语境是广义的语境，既包括人们一般意识中的“语境”（实际上是特殊语境），也包括比如像“言语社区”这种一般说话人习焉不察的语境。同样一句话，同样一种语言行为，换一个社区，换一个环境，可能就无法表达其原来的意义，甚至适得其反。最近网上讨论，“你是什么垃圾”这句通常是骂人的话，在垃圾分类站却失去了其骂詈的意思。其骂詈义的消除可以证明，该语句在超语境条件下是不包含骂詈义的。虽然，对该语言用例的解释多从句法角度出发，指出其“鳗鱼句”的性质，似乎“你”和“垃圾”不必同指一个事物。但是，问题的实质是，既然该语法意义不是强制性的，为什么该语句作为骂詈语使用的时候，人们要选择其骂詈的意思来理解呢？还是语境决定的。语境包括很多内容，骂詈语的使用需要确立话语发出者以及话语接受者的关系，至少他们有一些共同的关于骂詈行为的背景知识以及骂詈语的使用规则。在特定社区中，特定的骂詈语需要使用特定的语气，甚至特别的语音表现形式，诸如此类的种种“语境化提示”（contextualization cue）（Gumperz，1982）组合在一起，才使得其语言表现符合其“骂詈”的言语行为的规格，才能产生其骂詈效果。

举出上述例子，不是要说明“骂詈”的特殊性，而是要说明语境在言语交际中的必要作用。在成熟的言语社区中，人们对礼貌语言、骂詈行为、符合各种场合和身份的言语行为的“得体性”都有一些约定俗成的理解和期待。因此，“语言知识”既包括语音、语法、词汇的知识，也包括有关各种言语行为（Austin，1975）的语用知识。然而，许多语用和语境知识的研究及其规则性特征还未受到人工智能学者的重视。同时，由于这些语用规则和语境意义的研究的缺乏，人们对其的理解停留在“潜规则”的层次。然而，就是这些规则在指导着言语社区成员进行日常生活的交际，其实现的概率性不亚于语音、语法等其他语言规则的概率性。