购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第二节
算法新闻

一 核心概念

“算法”并不肇始于新闻传播领域,而是来源于应用数学的实践领域,指代解决某类具体数学问题的普适方法。随着计算机在社会各个领域的迅速发展和普遍应用,算法从纯数学应用进入社会科学领域,尤其近年来人工智能在决策服务方面的出色表现,“算法”成为网络的热议词。简单点说,算法在用户和信息之间构建了一个适恰的逻辑,目的是帮助用户更轻易地获取最有意义、最有价值的信息。例如,聚合类新闻客户端、短视频平台推荐用户感兴趣的信息产品;用户在网络购物时,APP推荐符合用户意向的商品;用户在使用打车软件时,APP规划的路线和计费预估;用户在浏览网页时,网页上推荐的各类广告;等等。

在移动互联网、大数据、生物传感等技术的推动下,以大数据为支撑、以算法为引领、用户与计算机实现高度数据交互的算法新闻正在传媒业获得越来越高的重视,诸多媒体机构急切地进入算法新闻领域,以图尽早占据智能新闻应用的前沿阵地。算法、大数据和人工智能等技术正驱动媒体变革:新华社的快笔小新、腾讯Dreamwriter新闻写作机器人平均出稿速度0.5秒;采用算法推荐的今日头条APP已经拥有1.4亿活跃用户;南方财经全媒体舆情服务平台能在2分钟内获取各类敏感数据、动态展现舆情;京东方的基于深度学习的图像处理算法“16倍超分算法技术”,能够对低分辨率新闻图片和视频进行16倍数级清晰度提升;在判断虚假新闻、新闻情感分析等方面,算法能够帮助新闻工作者省去大量重复性高、效率低下的人工审核工作。

从狭义上来说,算法新闻是指通过算法生产完成的新闻产品。但在实际的应用过程中,算法在新闻生产领域的嵌入已经不仅仅局限在“生产”的环节,对原始数据的接收和判断、对信息的传递、与用户的交互等环节均广泛运用了智能算法技术。可以说,从广义上讲,算法新闻是运用智能算法工具自动生产新闻并实现商业化运营的过程、方法或系统。 [4]

伴随算法的不断优化改良和大数据的海量积累,“算法新闻”的内涵不断延伸,其自身的定义和说法也在更迭。比较常见的表述有“机器人新闻(Robot Journalism)”“自动化新闻(Automated News)”“算法新闻(Algorithmic Journalism)”,“机器人新闻”强调了新闻生产的主体区别于传统的新闻工作者,“自动化新闻”强调了新闻生产的过程机制,“算法新闻”则强调了这一创新性的新闻生产的本质,是由算法程序驱动新闻生产流程的变革。

近年来,中国越来越多的学者采纳了“算法新闻”的概念,并接受了以下定义:“运用智能算法工具自动生产新闻并实现商业化运营的过程、方法或系统,它包括信息采集、储存、写作、编辑、展示、数据分析及营销等业务的自动化实现” [5] 。该定义超越了从狭义上界定算法新闻是一种产品的视角,算法新闻不仅指代新闻产品,还涉及智能算法嵌入新闻线索发现、新闻生产、新闻传播、用户消费、舆情监测和反馈的全过程。该定义从广义上去界定“算法新闻”,为其赋予更多的内涵和外延,并随着科学技术和媒介技术的发展,尽可能保证其定义的适用性、可拓展性、灵活性,在当前的技术环境下相对更准确地揭示了算法新闻的本质特征和基本规律。因此,本研究为规范相关的理论和实践研究,对“算法新闻”的定义是广义上的。

二 算法新闻的应用领域

新闻信息推荐和分发:这是算法新闻的典型应用领域。算法在一定程度上取代了由编辑决定新闻分发的传统新闻信息传送路径,算法通过对用户接收信息行为大数据的分析,在既定程序的框架内自主向用户推荐和分发新闻,而获得推荐的新闻实现了精准连接信息内容与用户兴趣,将用户的需求与新闻内容的个性化结合起来。像国内的今日头条、一点资讯、天天快报等APP,就是典型的新闻推荐和分发平台,今日头条多次声称“没有采编人员,不生产内容,没有立场和价值观,运转核心是一套由代码搭建而成的算法”。

写稿机器人:算法通过分析和整合即时数据,将数据与新闻报道模板进行对照,并为模板嵌入合适的数据和话语,在短短数秒内就能自动生成条理清晰的新闻稿件,并推送至各类信息平台。目前,写稿机器人在以数据为核心要素的新闻领域获得了普遍应用,如体育赛事报道、金融分析报道、突发自然灾害新闻、天气新闻等。早在2014年,美联社就与Automated Insights公司合作,利用基于算法的程序Wordsmith进行财报新闻的写作;在中国,新华社的“快笔小新”(现在又有了新华智云)、腾讯的Dreamwriter、今日头条的张小明(Xiaomingbot)、微软的小冰等写稿机器人,都能够利用数据和算法,快速搜集、分析、聚合新闻内容。

新闻信息数据分析:这是涉及大数据分析、知识图谱、语义辨识、内容理解、情感分析等一整套系统性的算法技术,对新闻传播过程中积累的数据进行再挖掘和开发。新闻信息数据分析的重要应用之一是虚假新闻识别,即利用算法模型,对信息的文本、配图、用户特征等进行多模态内容分析,从而判断其真伪。网络各类平台中的文、图、视频等都可能滋生虚假信息,如果被媒体广泛转载和传播,就会成为虚假新闻,对社会秩序带来严重危害。《科学》就曾发文指出2016年美国总统大选期间,平均每个选民每天要接触4篇假新闻。

目前,国内已有针对虚假新闻识别的竞赛,例如,中国科学院计算技术研究所、北京智源人工智能研究院就共同举办过互联网虚假新闻检测挑战赛。部分国外媒体已经运用算法辅助新闻线索和社区评论的监测,例如,美联社的NewsWhip能够对社交媒体上的讨论进行追踪和预测,通过特定算法,预测趋势和情感,给编辑部提供实时观测和预警,以便记者和编辑能够更精准地把握新闻线索,辨别假新闻。《纽约时报》的Editor通过识别语义,提取关键信息,提供可靠的新闻事实核查功能;同时能够帮助编辑们处理每天高达1.1万条的读者评论,这涉及情感分析和数据过滤。

数据可视化新闻生产:数据可视化是非常高效的向用户展示新闻内容核心要素的方式,通过数字和图表,直观、对比式地呈现关键内容,有利于用户快速阅读和理解新闻的价值。对于新闻媒体而言,数据可视化新闻是吸引用户的创新途径。算法能够在后台提供快速访问数据和生成数据比对的能力,帮助采编人员生产形式更丰富、内容关联度更佳的信息。例如,央视在春节期间制作的春运迁徙图,每年全国“两会”期间的“数据看‘两会’”等,就是典型的数据可视化新闻生产的应用。

聊天机器人:聊天机器人目前是算法新闻发展的着力点,聊天机器人嵌入新闻报道页面中,利用算法,实现对用户信息需求的归纳,分析用户聚焦的主题、人物或报道类型,用户能够通过文字、语音等方式,与聊天机器人实现人机交互。《卫报》就推出了适用于Facebook入口的聊天机器人,能够每天在后台通过Facebook Messenger向用户推送精选的新闻报道,借助文本分析和语音识别,与用户即时交互。

智能视频和图像应用:算法在图像边缘检测、图像分割、图像识别、图像匹配、图像分类等领域广泛应用,衍生出一系列新闻产品。例如,2017年建军节人民日报客户端策划的“军装照”,就运用了腾讯开发的智能图像捕捉和深度学习技术;为庆祝中华人民共和国成立70周年,人民日报客户端推出京东云提供技术、基于AI“换脸”功能的首部全民定制国庆献礼片《70年,我是主角》,让用户也能够自己“演电影”。

可见,算法新闻的核心在于更好地为新闻媒体赋能,在某类有固定范式的新闻生产环节减轻记者和编辑的工作,帮助新闻工作者提升报道的效率和质量,对新闻业和意识形态领域的信息传播产生了极重要的影响。

三 作为“技术”的算法新闻

杜威(John Dewey)对技术充满了积极和乐观,他认为技术具有生产的属性,人类总会使用技术去应对自然界和生活中的困难,既然带有目的性,那技术就必定不会是价值中立的。这也是技术如此令人着迷的原因,人类会用技术去探究,反过来,技术则推动了人类社会的变迁。

在杜威看来,技术的内涵很广泛,人们通常上理解的“工具”理所当然是技术,而人类的思考能力、探究行为也是技术,只要是人类主动去控制、克服自然界或社会上的障碍,涉及的实物或努力都在技术的范畴之内 [6] 。因此,人类的观念、意识、技艺、思辨、创新同样都是技术,我们不能纯粹以物理意义上的“物件”来理解杜威的技术哲学思想,这为从“技术”视角理解算法新闻指明了方向。

在杜威的技术哲学观下,算法新闻何以能被视作一种“技术”?根据以上分析,可以从人类观念和物理功能去分别理解。首先,算法新闻的理念内在是人类意识的物化。例如,稿件推荐和分发来源于算法对用户大数据的深度分析,是用户新闻价值观的客观反映;写稿机器人融入的是新闻工作者的新闻生产技巧,而这类技巧源于长期经验的集合;新闻对话机器人的技术反应机制是人类的日常话语,而这些话语来源于意识的表达。算法本质上是一种未经利用的技巧(按杜威的说法也可理解为技术实现的“原材料”),将其植入新闻产品的生产和传播,就被赋予了信息传递和反馈的属性,而不再是那一串毫无意义的0和1。

其次,技术是具有实用价值的,其天然的属性之一是人类为了实现某个目标而付出的劳动(包括体力劳动和脑力劳动)实践,正如铁矿在未被开采之前,只属于自然界的“原材料”,当被用于制成各种器械和工业产品,才具备了技术的属性。而算法新闻的载体是各类智能终端,如智能手机、移动计算机、传感器、VR设备等,算法在这些终端的应用延伸了原媒介的功能,以及在一定程度上实现了对包括人类交往方式、认知方式等在内的社会文化的改变。可见,对于算法新闻来说,人类的智慧和意识是本质,新闻产品则是载体。

可以说,在算法新闻发展的过程中,人类将技术作为实现创新和发展的工具以及对未来美好可能性的探究,与由此衍生的社会文化变迁交相辉映,这是技术对人类主观意志和社会发展客观规律的反映。

算法新闻为产业创新提供了无限的畅想,依托智能算法、大数据等技术支持,越来越多基于算法的应用服务于我们的生活。例如,新闻分发帮助用户节省了搜索感兴趣的新闻的时间,VR新闻让视觉上的现场参与感更进一步,智能图像识别和更迭、语音识别等拓展了社交应用,等等。这些技术在不断的修正和完善中赋予我们生活新的方式。

正如基于算法的机器人写作就是解决用户对新闻时效的极致追求与新闻写作的非即时完成的矛盾,这是算法作为一种工具被赋予的意义,同时更是对传统新闻生产模式的创新和重构。这为我们理解人类在面对自然和社会时做出的努力提供了积极的研究取向,工具的目的就是以积极的态度重整经验,从而克服现状与预期的不协调。

四 人机交互:算法新闻的元传播环节

(一)何谓“元传播”

美国社会科学家格里高利·贝特森(Gregory Bateson)于1951年创造了“元传播”(meta-communication)一词,meta作为前缀置于抽象概念之前,表示该概念的进一步抽象。贝特森根据这一构词法,将“元传播”指代为人际互动中“关于传播的传播”现象,即所有被交换的涉及编码(codification)及传播者之间相互关系的线索和命题。 [7] 元传播概念的提出为我们理解和创新性地解释人际传播提供了一个思考的路径。在人际传播的过程中,个体通过对信息采取富有个人特色的编码,将外界的信息转化为自我可理解的模式,在与他者的互动过程中建立起与自我、他者、社会的联系,人际关系形成的基础是相互关联过程中的信息编码和传播。基于这样的哲学思考,元传播成为一个重要的理解人际传播的理论概念。

元传播是认识论的基点。个体要认知现实的性质和存在于现实中的知识,就必须通过传播的通道,将外界的事物转变为内在讯息,这包括与他人的交互,并建立起与自身内部、他人、环境的联系,在这个过程中,个体的意识和社会关系就形成了。个体的自我认知与外部世界的现象时常存在明显差异,这时就需要个体对外界讯息进行“解码”和“翻译”,将重新编码后的讯息存储到自己的认知系统中。我们可以将之理解为个体内在的精神活动对外部世界的“映射”,并转化为自己的观念和认知。因此,如何对外界事物“解码”和“编码”就格外重要,这涉及后续的信息交互和反馈,并有可能决定人际关系的走向,以及人际间的共通意义是否能够形成。

元传播可以用来分析社会公众之间以公共事务为核心的关系形成,例如,在全国“两会”期间,某高校教师以此重大政治事件为契机,在微信朋友圈发表关于高等教育改革的话题,可能会涉及提建议、发牢骚、表明态度、呼吁关注、批评某类群体或个人等倾向的信息。对其朋友圈可见的微信用户会以不同的方式对该教师发布的内容进行解码,并将解码后的信息与自我的价值理念、对该名教师的认知结合起来,从而决定该以怎样的方式回应(赞同、反对、默不作声),或通过点赞、评论、发朋友圈回应、去论坛发帖等方式表达观点。双方之间经由此条朋友圈信息,引发了关系互动,这一过程涉及自我情感的表达、对他人的认知、反馈行为,信息传播包含了内容意义和关系意义,影响着人际后续的交往。如果该位教师的朋友圈信息含有隐喻、幽默、反讽等艺术性表达或其他并不明朗的话语形式,解读讯息的意义则成为此次元传播的核心。

综上所述,我们可以对元传播的意指有明确的认知。元传播是一个能够解释人际交互和社会实践的概念,它描述和解释了人的意识和人际关系的形成,而在人际传播和人际关系的形成过程中,包括了许多意义清晰、逻辑显而易见的信息,也可能会充满了隐喻、玩笑、语境、艺术化表达、表情等需要根据不同情境去理解的信息,这些信息的内容与意义是融合在一起的,即促进人际关系和社会关系形成的“元讯息”,构成了对原始讯息编码的依据。元传播指代的就是这些元讯息的传播。通过元传播的视角,可以从人的意识、感知、认知等内部层面理解人际传播的形成,获得比较合理的人际交互行为理论解释,并借此实现进一步的基础理论创新。

(二)人机交互为何是算法新闻生产和传播的元传播环节

在计算机科学界,科学家和设计人员将人与计算机的交互类比为人与人的交互,因为两者具有相似的规律,尤其在大数据和人工智能时代,计算机更多地被人类赋予“认知”和“理解”的功能,信息处理的过程不再是人类发出指令之后,计算机被动接受和执行指令的单向线性信息传递,而是人与计算机作为共同的主体,在同一话语体系内借由经验、知识、理解和反馈完成信息交互。

在人机交互的信息传播过程中,感知、认知和行为三个功能模块构成了信息处理系统,各个模块在完成信息接收、处理、加工、存储、反馈等功能的基础上,为其他模块提供信息的输入并作为其他模块信息的输出口。人类和计算机在统一规范下构建和完善自身的感知、认知和行为模块,在大数据和人工智能的技术支持下,算法新闻的感知、认知和行为模块的功能日趋与用户接近,算法让计算机在理解和预测用户的兴趣、意图和情感时更有科学依据。

算法新闻下的人机交互是并行的,用户和算法应用会同时接受来自各个信道的信息输入,感知和判断对方的意图,在既有经验(对于计算机而言是固定算法)的帮助下存储、记忆和提取信息,并更新对交互情境的认知,经过多层筛选和过滤的信息最终会汇聚于决策系统,用户和算法决策后将信息向对方反馈,或做出相应的行为。在智能技术广泛应用和大数据传播无处不在的技术背景下,人机交互的流程持续进行和更新。

例如,写稿机器人、数据可视化新闻与记者编辑存在最直接的人机交互,足球赛事、财经新闻、自然灾害播报、突发公共事件民间舆论调查等涉及数字和文本采集的新闻生产,预设了机器获取数据的接口和处理模式,包括最后的新闻分发平台的选定,都是由特定的算法实现的,这个算法背后的逻辑就是记者和编辑们的专业认知,包括新闻写作的技巧、文本内隐情感的判断方法、核心数据的选取、关键节点(如以“小时”为时间单位的舆论走向)的设定等。经由算法,记者和编辑的认知得以与机器交互。聊天机器人更是趋近于日常的人际交互,在海量文本和算法的支持下,机器人以“虚拟人”的方式存在,与用户在对话的过程中实现了内容意义和关系意义(如用户是否信赖聊天机器人、从人机对话中获得的满足感、决定是否升级和继续使用聊天机器人等)的交互。

可见,算法新闻生产和传播的前提是人机交互,这决定了如果要从微观上审视算法新闻,人机交互是绕不过的一个关键点。

首先,算法不是凭空产生的,而是科学家知识和经验的产物。只有科学家借助计算机,运用一系列函数、公式、命令符,将数据的表象与事物的本质联系起来的时候,算法才真正称得上具备了自然意义和社会意义。通过科学家与计算机之间在知识和认知层面的人机交互,算法才得以诞生,算法被植入各类新闻生产和传播平台后,算法新闻才得以成为用户与计算机交互的路径和成果。

其次,算法新闻依赖于新闻工作者与计算机的交互。算法新闻的生产环节离不开新闻工作者的参与,在机器人新闻的算法和程序输入环节,离不开记者的参与,记者的专业知识和技能确保算法最后的生成品符合新闻规范和伦理,此时的算法本质上是记者对新闻创作的理解。而在算法新闻的传播方面,算法新闻以怎样的形式与用户见面,是智能图像应用、H5、数据可视化新闻,还是沉浸式的VR新闻,都取决于编辑的决策。

最后,算法新闻依赖于用户与计算机的交互。算法新闻的传播必须借助海量的数据,而大数据不是凭空产生的,其中很重要的一部分数据的直接来源就是广大用户,如“春运大数据”“‘两会’大数据”等数据可视化新闻产品的内容就直接来源于用户大数据。智能影像应用更是需要用户主动与机器交互,如“军装照”“我的前世青年照”“70年,我是主角”等智能应用,就需要用户上传自己的头像图片,经过智能算法的处理后,生成个性化的图像和影像。另外,当人机交互发生时,并不是纯粹的信息传输,同时还存在兴趣、意图、情感等隐喻,比如在智能舆情分析应用中,部分公众话语存在正话反说、反讽、代号等现象,这种人机交互就超越了传统计算机处理的能力,需要通过机器学习,不断更新算法,以适配特殊的情境。

可见,人机交互是算法新闻生产与传播过程中的基本关系构成,不是传统意义上的人类拥有对机器的绝对支配权,人类与机器的关系更趋向于在信息传播环境中的“共生”,两者相互扶持。人机交互是算法新闻内容生成的前提,人类与智能算法交互的进步推动了媒介环境的变革,两者共同构建了新的网络文化场域,信息生态也随之衍变,这也反过来推动算法的自我更新和人机关系的改良,以实现更有效、更合理的人机交互。

因此,可以将人机交互视作算法新闻生产和传播的元传播,此研究视角借鉴了传播学当中的人内传播和人际传播,有利于从本质上分析与算法新闻有关的传播现象,并最终从微观层面上探讨算法新闻与人类的关系生成和变化。 uiw/LcriOPa0r7BoxOQpiDucxfZcAnkUZNLeSCxDJCtxN9b9BGGY7GN7z1XLk49R

点击中间区域
呼出菜单
上一章
目录
下一章
×