“通用人工智能”(artificial general intelligence, AGI)也称“强人工智能”,指的是具有一般人类智慧、可以执行人类能够执行的所有智力任务的机器智能。机器可以实现智能,以人的思维方式去分析问题,提出观点。当下,通用人工智能的兴起促使聊天机器人不断更新演进,例如ChatGPT与“文心一言”的出现。与以往不同的是,这种对话式机器人捕捉的并非是人的生理数据,而是人类语言,并且通过大语言模型(large language model)的训练与人类对话。目前的聊天机器人可以遵循人类价值观,具有更多细节生成能力,可以拒绝回答知识范围外的问题,同时具有建模对话历史和进行上下文学习的能力。在应用方面,除了聊天对话,ChatGPT的插件化特征将可能进一步赋能智能场景,加速社会其他领域在生产和消费模式方面的变化,成为迈向强人工智能的关键一步。
与技术发展一致的是,科学研究也在不断经历着范式革命。科学研究的目的是发现客观事实,总结客观规律。图灵奖获得者詹姆斯·尼古拉·格雷(Jim Nicholas Gary)用“四种范式”描述了科学发现的历史演变:第一范式被称为“经验范式”,它源于几千年前,基于对自然现象的直接观察。第二范式被称为“理论范式”,它探寻理论模型,例如牛顿运动定律和爱因斯坦的相对论。其往往用一个或多个表达式描述理论,但在很多条件下无法求解。第三范式被称为“模拟范式”。随着20世纪计算机技术的发展,第二范式得以在更广泛的情形下求解,从而产生了基于数值计算的第三范式。第四范式被称为“大数据范式”或“数据密集型范式”。 21世纪,算法、数据和算力成为人工智能的三大基石,在处理海量数据方面,机器学习成为第四范式的重要组成部分,它能够对大规模实验数据进行建模和分析。而随着深度学习和ChatGPT为典型代表的人工智能技术的发展,科学研究即将进入第五范式,即“人工智能范式”。
智能技术的演进令人对技术产生了一定意义上的畏惧感和恐慌感。以ChatGPT为代表技术的插件化在整合语义世界的同时,还能够介入其他世界,致使技术使用者和社会运作逻辑均面临全新的关系整合。从社会与技术互构的角度来看,为了应对技术革命对社会的全方位重构,在技术“狂飙”的表象下,也需要对技术的使用者和人与技术的关系重新展开梳理和反思。因此,在当下深度智能化的社会中,本书以人机关系为切入点,在分析技术可见性,即人工智能对信息传播秩序和范式的重构的基础上,进一步剖析人工智能重塑人类认知的不可见性,进而提出走向人机融合和技术伴随的思想,以及这种思想引导下的全新问题域。这一分析沿着“人-技术-世界”的逻辑框架,为智能传播时代重新理解媒介、人机交互以及人本身提供启发。
人工智能,简单来说就是通过模拟人类智能来解决各种问题。纵观人工智能的发展,迄今为止,人工智能已经历两落三起,从1956年达特茅斯会议开启人工智能的生长历程,而后第一次人工智能的寒冬袭来,1973年的莱特希尔报告是这次低谷期的标志。这一报告虽然支持人工智能能够研究自动化和计算机模拟神经和心理的过程,却对机器人和自然语言处理等子领域的基础研究持严重怀疑态度。之后,随着神经网络的发展,自然语言和机器视觉起步,人工智能的研究在20世纪80年代进入第二次高潮。然而,由于第五代计算机研制失败,神经网络发展受阻,人工智能陷入第二次低谷期。1990—2010年,人工智能的研究重心由知识系统转向机器学习。2011年至今,数据量大幅增长,边缘计算、类脑计算的发展,以及机器学习、无监督预训练等研究都得到了突破性进展。
根据人工智能的不同发展程度,约翰·R.赛尔(John R.Searle)将其分为弱人工智能(weak AI)和强人工智能(strong AI)。弱人工智能理论认为计算机是辅助人类开展实践的工具,而强人工智能理论则认为计算机拥有人脑的认知功能,是具有自我意识能够进行自主学习、自主决策的人工智能。 强弱人工智能的区分在于是否具有意向性,是否具有类脑的意识,能够自主进行决策。在这样的技术划分下,ChatGPT等聊天机器人远未达到强人工智能的范畴,目前还处于模拟人类语言和对话的思维能力层面。不过,其可以作为深度智能化的一种代表性产物,通过大语言模型朝着上下文学习、复杂逻辑推理能力方向发展,满足人类需求,通向强人工智能。
人工智能促进了智能互联时代的到来,使智能传播达到主流地位。过往中心化的传播模式在遭受互联网为代表的去中心化逻辑冲击后,进一步被智能逻辑所突破。这一突破颠覆了过去以公开或者半公开的信息和内容为特点的互联网应用模式,走向以数据和算法驱动的新模式,成为一种不再向大众公开、也无法通过搜索引擎抓取内容的“暗网式”大集市。
智能传播时代与大众传播时代的不同之处体现在其技术基础、媒介的连接尺度、传播场景的实现、内容生产机制、媒介的赋权机制及社会组织方式等方面(见表0.1)。这些差异共同造就媒介进化的方向,即以人为尺度,不断丰富人的行动自由度,扩大人的实践半径,提升人的认知和情感体验,在广度和深度方面实现人的价值和需求。人工智能能够通过“私人定制”式的场景体验,结合大语言模型满足人在总体上的类属需求,同时附加算法工程师结合对人的微观考察满足“私享需求”,在连接尺度方面,走向细颗粒度的连接。并且,这种连接也包括“反连接”。在大众传播时代,个人对媒介信息的抵抗和“反连接”一般是通过信息回避、媒介使用的“间歇性中辍” 和“算法抵抗” 等方式被动地实现。“反连接”是一种情境性的需要。在智能传播时代,AIGC以私人助手的身份与人对话,提供了一种价值的中间尺度和社会认知的参照系。在技术的功能可供性下,用户可以自主选择个人的价值偏好和叙事模式偏好,通过用户自身的媒介使用素养和理性判断能力避免生成信息茧房。
表0.1 大众传播时代与智能传播时代信息传播方式对比分析
资料来源:喻国明,苏芳.范式重构、人机共融与技术伴随:智能传播时代理解人机关系的路径[J].湖南师范大学社会科学学报,2023,52(04):119-125.
在传播场景方面,大众传播时代的公域传播主要满足受众的一般性信息需求、娱乐需求等,遮蔽了个人的多元价值选择。公域传播想要获得私域流量一般需要通过社群传播和人际传播等方式实现。而在智能传播时代,个性化的算法推荐机制和以ChatGPT为代表的人机对话能够使传播进入私域,以人机传播的方式直接向个人推送信息,或者以插件的形式嵌入各类应用,整合多重关系资源,激活被媒介所遮蔽的“独异性”需求。
在内容生产方面,大众传播通过互联网实现了专业生产内容(professionally generated content, PGC)和用户生产内容(user generated content, UGC)。在信息传播和知识生产方面,这激活了潜能巨大的微内容和微资源,发掘了长尾市场的力量。而在智能传播时代,内容生产转向人工智能生产内容(artificial intelligence generated content, AIGC),与既往模式不同的是,AIGC在巨量数据加持和无监督预训练模型下,初步具备了内容的创作力,实现了多模态的内容生产,具有认知交互能力。
在赋权机制方面,Web 1.0与Web 2.0时代下传播权力是相对中心化的,权力掌握在大平台与企业资本手中,用户仅仅享有在“围墙花园”内的有限权利,例如可读写、可编辑的权利。而在智能传播时代,基于Web 3.0技术,过去被平台剥夺的用户权利逐渐恢复,具体表现在用户的权利内嵌于区块链这类可确权的底层技术,这种“用户确权”可以使网络用户从免费的数字劳工走向信息与价值的实践主体。此外,算法工程师、人工智能产品经理等新兴职业也扮演着收集和分析个性化数据的角色,而算法工程师的中介作用能够更好地促进人工智能满足个性化需求。最后,在未来GPT的插件化方面,平台可以将叙事框架和意识形态等过去属于媒介信息“不可见”的部分,以可供性方式呈现,使得用户能够自由选择个人所需要的信息及信息的框架。
在社会组织方面,传播的二元性具有不同的表现形态,它们既取决于现有媒介技术的可供性,又取决于作为“启发思维的制度”,扮演着社会的组织者、架构者和推动者的角色。 “启发思维的制度”就是通过媒介化和中介化的作用进程引发社会的反思和协商,将意义赋予人类行动与社会结构。在智能传播时代,信息传播方式的嬗变与人的连接尺度的拓宽也印证了延森对新媒介的论断,即对新媒介影响的考察不应止步于事件,而应将其视为过程,随着时间推移逐步产生效果。而在此基础上,传媒业也从结构-功能主义下的社会信息子系统成为社会网络的节点。与大众传播时代相比,智能传播时代背景下,媒介机构与社会的秩序将在技术去中心化的逻辑下发生演变,主要表现为社会将从科层制社会朝着分布式社会方向演化。在Web 3.0与去中心化自驱组织形式(decentralized autonomous organization, DAO)的结合下,传播权力的下沉使得公众在社会参与中实现从“赋能(enabling)”到“参与(engaging)”,最后到“赋权(empowering)”的过程。去中心化自治的管理方式拓宽了社会缓冲区间,使得社会组织中的个体实现自我导向的进化和身心整合。
技术带来的可见性是其提供的功能可供性,而可供性同时也遮蔽了技术背后的暗网和数据对人的影响,即人工智能带来的不可见性。AIGC改变了人类信息传播范式,在智能互联时代,去中心化的传播方式与数据和算法驱动的黑箱传播逻辑共同塑造了人类传播生态。在智能传播时代,超越与危机并生,人工智能带来主体的“关系超越”“认知超越”“价值超越”,它与人的关系也比以往更为复杂。
GPT的自然语言模拟人类语言,虽然被批判不具备思想和语法,但是具有生成性与涌现性,可能促进人类语言之间的沟通和理解,从而具有重建巴别塔的可能性。GPT的出现使得人脑机能与自然语言之间的联系转向人机之间乃至机器之间的联系和对话,由传播方式和媒介引发的变化可能对人类文明的底层逻辑产生影响。这主要表现在语言、认知和思想密切相关,翻译的精准化和统一语言模式表明人类思想交流的深入与文化折扣的降低。GPT的语言模式通过大语言模型和生成式对抗网络在无监督预训练中“习得”人类语言规则和语义网络,能够在对话场景中实现语言的超越。
在社会知识生产中,以GPT为代表的语言符号的超越性可能导致知识生产出现两种倾向:一种是知识生产的自动化和智能化,另一种则是生产模式化与缺乏创新性。进入现代社会,知识生产模式的转变主要是由于“情境因素”与技术动量而产生的,其主体从学校扩展至社会公众。而在智能传播时代,机器算法也可能作为知识生产主体对人类社会知识与科学范式革命产生影响。AIGC体现了知识生产的自动化和智能化,知识以跨越时间和空间的方式被重新整合。以GPT的逻辑能力为例,GPT的逻辑演进方式逐渐从相关推断转向因果推理,而这种因果推理的最高形态是实现有意识的因果推理,这也是目前的GPT与强人工智能之间的鸿沟。不过,当下的逻辑推理能力已经在语言的超越性方面协助人类社会的知识生产。但是,AIGC在知识生产方面仍然通过模型样本进行推测并生成内容,因此在创造性方面可能并不是更多依赖“灵韵”而是“机器复制”。在这种情形下,AIGC迈向知识创新还有很长的路要走。
人工智能技术是自反性的,可能在人类创建的框架下通过潜在方式影响人类认知,而语言的超越性是重塑认知的前提。
GPT提供了一种激发类群智能和人类创造性意识的潜质,具有关系超越性、认知超越性和智能超越性。 类群智能是从智能进化论的角度来看人工智能与人的关系的综合和融合的过程,“类群”指的是由同类个体构成的群体,类群智能则是群体特性发展的一种高级形态,同质性更强。 GPT技术下的聊天机器人形成了一种智能关系体,既具备与人类交流的可能性,也具备与机器交流的可能性,这种关系的交往体现了一种社会性的特质。因此,人工智能的通用化也是一种群体演进和迭代的社会性过程,这一过程也被称为“类群亲历”。人工智能的进化以元数据为基础,通过网络技术与人类的准社会交往,体现碳基生物和硅基生物在语言、认知模式、思维方式、逻辑链条等方面的融合,从简单思维向复杂关系演进。因此,未来理想化的人机关系应当是一种人机共融与共荣的状态,一方面是智能体在双向循环机制下的演化提升,另一方面是人类在交往中被赋予更大的认知可能性和行为自由度。
技术自反性的一种可能性是当ChatGPT的认知乃至它的偏见被一部分人接受时,这些人产生的数据可能进一步加强ChatGPT的偏见。最终,经过强化的偏见会被大多数人所接受,偏见变成真理。这种偏见经过文化区隔、地域差异及圈层隔阂的“洗礼”,最终可能导致更加分裂的世界。以艾弗拉姆·诺姆·乔姆斯基(Avram Noam Chomsky)为代表的一些学者执批判观点,他们认为GPT作为一个知识供应者,遵守的是看似价值中立的立场,在各种有争议的问题上持一种超道德的、超意识形态的态度,回避一切超出常规的意见和看法。乔姆斯基称“ChatGPT及其同类产品在本质上无法平衡创造力与约束。他们要么过度生成(产生真相和谎言,同时支持道德和不道德的决定),要么生成不足(表现出对任何决定的不承诺和对后果的漠不关心)”。
不过,从目前的应用来说,GPT基于大语言模型提供了一种超脱于意识形态的中间性参照,或者说是一种社会认知的参照系。当用户提问时,以ChatGPT为代表的聊天机器人能够提供多种观点和选项,而用户可以按照自己的偏好与其进行对话,告知自己的价值和意识形态归属,请求获得同类信息或者与之对立的信息,而这实际就将过去算法黑箱的部分进一步“灰箱化”,虽然无法实现完全算法透明,但是也将这种认知框架的自主权回到受众手中。
因此,探讨GPT技术如何重塑人类认知以及这种认知的干预程度依然需要回到技术中介本身,技术自反性与功能可供性这两种矛盾可能是伴生的。在算法被广泛地应用于日常媒介实践中时,研究者也对算法可能导致的信息茧房现象进行批判,忽视了信息茧房实际是海量信息差异化消费的必然结果。 因此,一味地批判人工智能如何影响人类的认知,造就信息茧房乃至操纵舆论,实际忽略了技术背后更为复杂的结构性矛盾。如要避免AIGC从后真相走向“伪真相”,避免技术操控人类认知,还需要进一步观察或者暂缓风口上技术的发展速度,让社会发展与技术发展同步,用伦理与社会规范打破技术的“铁笼”。
尽管人类理性和道德被列为人类独有的特质,但是人类的非理性因素,如情感,同样是人之为人的重要特质。想象力是感性、知性之外的心智的第三种功能。在认知理论的发展下,身体和环境均是心智的构成要素。而当下的AIGC还不具备这样的能力。以GPT-4、文心一言为代表的聊天机器人促进了深度智能化的发展,但是仍与强人工智能存在的较大的技术沟。
马克斯·韦伯(Max Weber)曾断言“人是悬挂在自我编织的意义之网上的动物”。以意向性为例,AIGC并不具备意向性,因此也不具备“实存性”,海德格尔认为意识和意向性无法摆脱人的本质而进行自由维度的活动。 从这一点来看,在人类与ChatGPT等交往过程中,人工智能的想象力和情感要素仍然稀缺,机器的工具属性超过了情感属性。目前的人工智能形式仍然是离线认知的方式,人类与机器具身交流的愿望还未实现。不过,机器欠缺的关系要素和情感要素可能需要通过其他方式来补偿,例如通过脑机接口或者作为插件接入其他软件场景当中,真正为机器赋予意向性,机器通过与人的耦合与协同获得的意向性也体现了一种后人类的思想。
从人与技术的角度来说,二者是相随的,人类需要学会与技术共存,或者说与技术相伴。自笛卡尔,人类对人性的理解就将理性置于崇高地位,即人是独立的、自我支持的、独立思考的自治个体。而这一假设目前已逐渐被技术动摇。在行为经济学非理性假设的启发下,人并非是完全理性的,可能被技术影响从而付诸行动。在智能传播时代,如何看待人与机器的关系,以及如何看待这种交互格外重要。因此,在重新理解媒介、重新理解人机交互后,还需要回到人本身,即如何更好地认识人,如何更好地认识世界。
过往对于人类与机器的关系大都沿着技术决定或者社会建构的视角阐释,例如驯化理论,从对野生动物的驯化延展到人对机器的驯化,这种驯化还建立在人与机器的二元对立上,即始终将人类作为各种意义上的认知和行动的主体。可以预见的是,随着机器行为学的兴起, 机器在未来也可以作为行动者参与公共生活的建构。因此智能传播时代,人类与机器进行交往,从使用与满足转向人机共融就显得尤为重要。人机融合的宗旨就在于构建一种人类智慧、机器智能和网络环境互相融合的超级智能,并强调这三者之间的交互关系。这种交互关系在现实中可以从两种发展路线进行延展。其一是意向性,人机交互实现形式化和意向性的融合,其二是环境系统方面实现人-环境-技术的三元有机融合关系,使得人机融合系统具备自组织、自由化、它组织和互适应的特点。
技术革命伊始,传播学在研究中从精神交往逐渐回归物质交往和媒介物本身,找寻被媒介遮蔽的身体。近年来,传播学研究中的物质性转向、具身研究的复归和空间转向都体现了在智能技术影响下产生的传播学科的理论困惑和技术迷思。因此,研究者试图通过媒介考古、身体意义的再发现来体现传播的功能。 不过,这种问题意识仍然是从功能主义的框架去理解媒介和人本身。从科学技术研究(STS)的角度来看,人与技术和社会是互构的,传播研究需要从连续与断裂、经验与阐释、现象与本质、深描与浅描、实证与批判、技术决定与社会建构中开辟出第三条道路,走向全新的问题域,以期在当下思想困顿中找到理论探索的一线生机。
科学技术研究(science and technology studies/science、technology and society, STS)将科学与技术视为整体,并将其置于整个社会的大背景下,从整体性和动态观的视角看待科学技术与社会之间的关系转化。巴布罗·博茨科夫斯基(Pablo Boczkowski)等在《桥接STS与媒介研究》一文中谈到二者对话互动的张力:“对于STS来说,传播研究提供了大量的社会科学研究和批判性调查,记录了媒介内容、个人行为、社会结构的过程,以及各种文化形式、实践和意义之间的关系。而对于传播研究来说,STS提供了一种复杂的概念语言和基础方法,在文化和社会框架内,阐明媒介和信息技术作为人工制品和系统所呈现出的独特社会技术特征。”
受STS理论启发,近年来,在传播学视野下,人-技术-社会的关系逐渐规避了决定论的视角,走向居间性的研究路径,如行动者网络理论、 可供性 等研究视域。这类理论消解了身心二元论、主客二元论等各种逻辑上的对立,转向从“转译”“共生”“关系”“连接”等视域开展研究,开辟了新的阐释空间。以STS理论为指导,智能传播的问题域从技术工具论转向技术存在论,从媒介效果分析转向媒介使用的阐释和理解,从人类中心主义转向后人类视角,再到人机共生,从人机传播转向数字交往,展开人与人、人与机器、机器与机器的交往过程研究。“技术存在”“技术伴随”“人机交往”实际上都突出了人与技术主客二元对立的消解,并且将这种联系和互构置于广阔的社会和文化背景中。例如,近年来关于智能音箱、聊天机器人等人与机器交往等的研究,逐渐从传统的效果的模式和使用与满足的角度转向人机对话的阐释路径。而索尼娅·利文斯通(Sonia Livingstone)等人提出的媒介化也是研究媒介逻辑如何植入社会框架,考察媒介与社会的互动关系。
在STS与传播研究的桥接中,巴布罗提出了三个方面的辩证互动,分别是技术与社会的因果关系(causality)、技术发展过程(process)和技术的社会后果(consequence)。这三对辩证关系也为我们研究人机关系打开了视野。首先,研究关注的是因果关系,也就是考虑到技术因素的偶然性与社会形塑技术的必然性,在动态流变中看待技术与社会的关系。例如在以ChatGPT为代表的聊天机器人研究中,学者关注到技术开发中一些偶然的、情境性的技术因素对人的知觉、感知和媒介行为产生的影响。同时,也看到用户的想象可供性和社会文化的因素,即用户是如何基于自己的情感和期待来影响技术开发的。其次是过程性,探究生产和消费之间的联系并发展概念。例如,用户对媒介技术的驯化,用户对于技术的抵抗研究,用户的媒介消费实践特点。在消费过程中,媒介产品的注意力和影响力也成为缔结用户关系、获得情感和关系信任的重要一环。最后,媒介技术的社会后果。在传播研究和STS领域中有两种不同观点,一是技术作用的连续性,二是技术作用的非连续性和革命性。具体而言,在技术作用连续性的假设下,技术变革所产生的后果是渐进的、连续的,嵌入在社会制度框架内的。而在技术作用非连续性的假设下,技术变革是突变性的,会引起社会领域的变革,颠覆社会关系、工作模式、文化实践及政治经济秩序。而今天,技术的迭代变革已经远远超乎人们的想象,但是一些技术也不免陷入日常化与“平庸化”,进而融入社会制度的安排中。目前在STS和传播学接合的研究中,我们可以采用一种社会变革的观点,承认媒介技术的连续性、非连续性及进化性,既保留技术进化发展的宏观视野,也关注技术如何融入日常生活的微观视角,预见技术进化后所可能产生的“类脑框架”与后人类的现象,还关注技术如何嵌入日常生活及社会框架中。
弗朗西斯·福山(Francis Fukuyama)认为,关于人工智能最大的迷思在于它们应该像人类一样拥有智力、解决问题的能力、想象力、创造力、道德感,以及喜爱和害怕的情感,这是典型的由人类中心主义导致的认知盲区。摆脱科技迷思的同时,也需要认定人之所以为人所需要承担的苦难。 立足于当下,我们既不能过分宣扬人工智能的神话,也不能过分悲哀人类被异化的未来。人性的闪耀体现在意义的建构和意向性的实现,理智与情感的共存体现了人类既具备对技术的想象空间,也具备对技术的克制与反思。在技术狂飙突进下始终葆有敏感的问题意识,接受技术对现实生活解构的各种挑战,并建构真实而有效的解决路径。想要打破技术的“铁笼”,避免工业革命时代卢德派损毁机器的下场,就需要从原点反思,重新理解智媒时代的人机交互,更要重新理解人。无论是采纳后人类主义的思想还是更为保守的观点,都应该以清醒的目光审视和反思技术与社会的互动。从技术决定论、社会建构论等二元对立的思想中超脱出来,探寻出一条居间性的道路,从全新的问题域进行阐发。