人工智能是一种引发诸多领域产生颠覆性变革的前沿技术,当今的人工智能技术以机器学习,特别是深度学习为核心,在视觉、语音、自然语言等应用领域迅速发展,已经开始像水电煤一样赋能于各个行业。最新统计数据显示,2019 年上半年,全球人工智能核心产业市场规模超过 335.9亿美元;我国人工智能核心产业市场规模超过 49.6 亿美元。世界各国高度重视人工智能发展,美国白宫接连发布数个人工智能政府报告,是第一个将人工智能发展上升到国家战略层面的国家。除此以外,英国、欧盟、日本等发达国家纷纷发布人工智能相关实施规划、行动计划等,把发展人工智能作为提升国家竞争力的重大战略,着力构筑人工智能先发优势。
党的十八大以来,以习近平同志为核心的党中央把创新摆在国家发展全局的核心位置,高度重视人工智能技术发展。习近平总书记多次强调人工智能健康发展的重要性,为人工智能如何赋能新时代指明方向,先后向国际人工智能与教育大会、中国国际智能产业博览会致贺信。自 2015 年起,已有《中国制造 2025》《“互联网+人工智能”三年行动实施方案》《新一代人工智能发展规划》《促进新一代人工智能产业发展三年行动计划(2018—2020 年)》等多个国家层面以促进人工智能发展为核心的政策出台,已经取得了积极的效果,我国逐渐形成了涵盖计算芯片、开源平台、基础应用、行业应用及产品等环节较完善的人工智能产业链。
20 世纪 40 年代初,英国科学家阿兰·图灵提出通过算法让机器学会“思考”的计算理论,此后,科学界就开始探索创建人工智能框架的方法。人工智能技术的发展大致可分为三个阶段,第一阶段(1956—1980 年)人工智能技术诞生及探索应用;第二阶段(1980—2000 年)人工智能技术不断发展步入产业化;第三阶段(2000 年至今)人工智能技术逐渐成熟迎来爆发。1956 年美国达特茅斯会议聚集了最早的一批人工智能领域的研究者,确定了人工智能的名称与任务,被称为 AI诞生的标志;1997 年深蓝计算机战胜国际象棋冠军卡斯帕罗夫,成为AI历史上的里程碑事件,受到摩尔定律的影响,计算性能开始大幅提升;2006 年,谷歌大脑人工智能团队首席科学家杰弗里·希尔顿(Geoffrey Hinton)在权威学术期刊《科学(Science)》上提出基于深度信念网络可使用非监督学习的训练算法,使得深度学习在学术界持续升温;2016 年,英国人工智能公司DeepMind 开发的AlphaGo击败前世界围棋冠军李世石,使得人工智能广泛进入普通人的视野。从目前的技术水平和应用现状看,人工智能包含着高级数据分析和大数据应用等,其中数据、算法、算力都是人工智能取得成就和突破的必备条件。
——深度学习技术逐渐在各领域应用。 深度学习借助搭建多隐层神经网络模型,在海量训练数据集的基础上学习到隐层特征,在各类型的学习任务上取得了最优算法性能。这种在海量数据集上进行有监督学习,并提取隐层特征的方法,能实现对特征高效的端到端学习,尤其适用于大规模标注数据集。深度学习已经逐步从实验阶段进入应用阶段,在各方面取得了令人瞩目的成就,其中包括计算机视觉技术在智慧安防、人脸识别领域的应用,自然语言处理技术在机器翻译、阅读理解及客服机器人领域的应用,语音处理技术在语音识别、语音合成等领域的应用,可以预计随着深度学习技术的不断深入发展以及与各个行业应用的深入结合,会有越来越多的智能应用在各个行业落地,并取得显著的商业成果。
——基础数据集建设已经成为基本共识。 早在 2010 年,斯坦福大学发布了一个包含 2 万多个类别、超过 1400 万张图片的图像标注数据集ImageNet。ImageNet 数据集的发布标志着图像处理领域有了大规模的基础数据集测量基准,此数据集逐渐成为业界图形图像相关算法性能的实际衡量标准。在ImageNet之后,一些企业和大型研究机构逐渐认识到大规模基础数据集对提升人工智能在领域内应用效果的价值,并逐步开始建立属于自己的数据集,商汤和旷视公司构建的亿级人脸识别数据集、科大讯飞构建的大规模语音识别数据集、百度发布的多场景无人驾驶数据集等都是很好的样例。
——新型计算框架陆续成为产业界发展目标。 深度学习在计算机视觉、自然语言处理、无人驾驶、语音识别等领域取得了长足的发展。然而,随着深度学习模型越来越复杂,为实现各种网络模型架构,开发人员需要耗费大量时间重复实现各类底层算法与程序库。为实现更高效的深度学习模型开发,学术界和企业界推出了多种深度学习框架,包括 TensorFlow、Caffe、Torch、MXNet 等。这些框架的功能通常包括自动符号运算、GPU 加速、模块化封装等。
——因果推理与模型理解有待突破。 现有的深度学习模型能够通过发掘各种隐层特征,发现事件之间的关联性,建立映射关系,但是在现有的框架下,深度学习模型无法解释因果关系。简单来说,深度学习学到的是输入与输出特征间的复杂非线性关系,而非因果性的表示。深度学习是一种基于概率统计的算法,其学习到的是以概率表示的非线性连接关系,无法像人类一样进行举一反三的应用。
——基础数据积累难以满足模型训练需求。 深度学习模型性能严重依赖于大规模的标注数据集,然而数据的标注过程需要耗费大量的人力与物力,大规模高质量领域标注数据的建立需要进行长期积累。首先,在一些关键领域的标注数据还存在缺失现象,例如医疗行业,由于标注过程复杂且需要领域专家的深度参与,使得大规模标注数据一直是阻碍智能算法深入应用的瓶颈。其次,现存的基础数据集质量参差不齐,高价值的领域数据基本上由少数几家巨头或政府所掌握。基础数据集的缺乏,使得深度学习模型在领域中的有效训练与落地应用面临严峻挑战。
——计算框架和通用智能芯片之间竞争激烈。 现在已经有较多的深度学习计算框架,但是实际使用深度学习的场景众多,其相关应用呈现出碎片化的特点,不管从功能还是性能的角度来说,使用开源计算框架和实际需求会存在着较为明显的距离。目前,由于行业竞争及需求碎片化的原因,尚未出现既贴合产业发展要求且兼具统治位置的开源计算机框架。此外,面向深度学习的专用智能芯片尚处于起步阶段,且大多是处于专有领域的专有芯片,如面向智能驾驶领域的芯片、面向语音处理的芯片、面向人脸识别的芯片等,而能适用各种领域应用场景的通用智能芯片还需要较长时间的探索。
——人机和谐共处艰难探索。 由于深度学习模型存在的“黑箱”问题,使得深度学习智能系统在应用过程中存在很多安全隐患,例如特斯拉公司推出的自动驾驶功能在使用过程中出现了多起由于技术原因导致的严重事故,甚至出现人员死伤的情况。这些事故不仅造成了人们的生命安全和财产损失,也严重打击了人们对人工智能实际应用的信心。如何保证人类与智能系统之间的和谐共处、协同合作等问题,关系着未来人工智能技术在领域中的落地应用。
——算法理论不断优化。 从算法理论层面来说,将继续按照深度学习模型完善以及新算法提出的两条主线发展。首先,深度学习在提升可靠性、可解释性等方面的研究以及在零样本学习(Zero-Shot learning)、无监督学习、迁移学习等方面的研究会逐渐成为未来发展方向,这是发展深度学习算法所必须经历的,也是行业发展的必要条件。
——基础数据集愈加完善。 参照数据集基础来讲,现在发展的趋势是学术界与产业界共同合作构建含有语音、图像、视频等的通用数据集以及各行业的专业数据集,确保各种数据能迅速达到相关实施需求。这其中的需求来源包括多个方面,如人们对人工智能的认识不断优化升级,确保数据集的自建、清洗、规范、标注等工作在企业内部能有序完成;随着深度学习的发展,产生了大量辅助人类工作的智能化数据标注系统,提升标注的效率;政府集中引导,行业龙头协调配合,促使搭建更为专业标准的数据集,为行业领域人工智能技术的快速落地应用提供标准化训练数据集,并将逐步形成领域内检测算法性能的事实标准。
——计算平台与芯片个性化发展。 针对计算平台和芯片来说,企业出于自身利益选择自主研究计算框架与平台,甚至定义领域专用智能芯片等是属于较为常见的现象。企业要对数据安全性业务进行考虑,企业内部不信任各种计算平台;企业内部数据信息和平台都有其特殊性,为了更好地促进企业内部实际发展需求,可以对计算框架平台芯片进行独立自主研究;在开源技术生态建设方面,人工智能计算框架及相关技术尚未出现一家独大的局面,各头部企业选择自建深度学习计算平台,并大力建设相应的开源生态对构建企业利益相关的商业闭环具有重要意义。
——人机协同机制真正建立。 结合人机协同机制的“人在回路”设计,在未来将是智能系统发展趋势与必备能力。当前计算机智能并不是以人为中心来进行设计和构建的,而长期处于以计算机为中心的系统发展模式中。在很多场景下,甚至出现了大量违背人类使用规律的情况。针对此类情况,需要构建将人类的认知模型向计算机智能技术进行有效植入的方法,确保其在推理决策方面能够符合人类世界认知水平。随着通用领域知识库(WikiData、DBPedia、FreeBase等)与领域相关的专用知识库(如医疗领域知识库、地理信息领域知识库)的建立,将人类基础认知知识与人工智能技术相结合日趋成为学术界、产业界相互配合追求的目标,且能在预期时间段内取得良好的成果。
人工智能已经成为新一轮科技革命和产业变革的核心驱动力,正在对世界经济、社会进步和人类生产生活产生极其深刻的影响。当前,从世界范围看,随着人工智能理论和技术的不断完善,人工智能技术正在由学术推动的实验室阶段,转向由学术界和产业界共同推动的产业化阶段。人工智能是人的延伸,在有的领域能替代人类进行生产工作,有的领域能辅助人类提高脑力体力。人工智能技术的产业化应用也紧密围绕人类的生产生活需要展开,覆盖范围领域也在逐渐向多方向发展,包括医疗、教育、交通、安全、金融、家居等多方面、多领域。
近年来,随着医疗健康领域数字化、数据化的不断完善,人工智能技术得以在医疗领域深度应用。目前,人工智能已经在疾病风险预测、医疗影像、辅助诊疗、虚拟助手、健康管理、医药研发、医院管理、医保控费等各个环节应用并取得了一定的成效。美国、英国、日本等发达国家已经制定了相关支持政策并从国家层面规划实施,大规模地发展智慧医疗。在我国,2016 年以来,国务院及相关部委相继印发《关于促进和规范健康医疗大数据应用发展的指导意见》《新一代人工智能发展规划》《“十三五”卫生与健康科技创新专项规划》《关于促进“互联网+医疗健康”发展的意见》等文件规范和引导人工智能技术在医疗领域应用,新版《医疗器械分类目录》中也增加了人工智能医疗产品。
目前,几乎国内外所有的头部科技公司都在“人工智能+医疗”领域进行不断探索,以统一标准、开放平台等措施推动人工智能深度赋能医疗。微软、亚马逊、谷歌、IBM、甲骨文等联合开放技术标准,推动人工智能技术以更低的成本在医疗领域取得更好的效果;百度、阿里巴巴、腾讯等中国的互联网科技企业也充分发挥自身平台的特点与优势布局智慧医疗,如“腾讯觅影”凭借“AI医学影像”和“AI 辅助诊断”入选了科技部首批国家人工智能开放创新平台。
从人工智能在医疗领域的具体应用看,人工智能技术在患者诊断、新药研发、手术护理等场景中被广泛应用。例如,利用人工智能技术扫描医疗影像可以帮助医生更快速、更精确地获取信息,提高诊断效率;人工智能技术与大数据分析结合有效降低药物开发成本,美国生物科技公司BergHealth已经借助AI成功找到了癌症代谢的关键作用分子;医学AI机器人已被越来越多的医院、家庭所接受,开始应用于一些手术当中,一定程度上避免了因为医生高度紧张而出现的医疗事故,提高了手术的精准度等。
人工智能、大数据等技术的迅猛发展为传统教育提供了改革突破口,教育智能化成为教育领域发展的方向。人工智能正在逐渐改变传统的教育教学模式、教学方式和学习方法、学校的组织管理模式和评价机制等,为教育理念与教育生态带来深刻变革。
全球主要发达国家均加速推进教育教学创新,积极探索教育新模式、开发教育新产品,通过加强人工智能和教育的深度融合实现包容和公平的高质量教育、面向所有人的终身学习的教育。人工智能正在不断推进教育领域的创新发展,在个性化学习、个性化教学、虚拟(导师)辅导、教育机器人、基于虚拟现实和增强现实的场景式教育、基于编程和科技的人工智能人才培养等方面都已经有了广泛的应用并取得了不错的效果。
国外的一些科技公司在推动教育智能化发展方面已经取得了一些成果和经验,如澳大利亚的Smart Sparrow公司推出的“自适应教育平台”能够跟踪每一位学生的学习进度、发现学习瓶颈与困难并反馈给教师;英国的Whizz Education公司推出的在线辅导教学产品“Maths Whizz”借助人工智能技术研发了虚拟老师,可以自动回答学生的问题并根据学生的反馈调整解答方式,直到学生完全掌握;爱尔兰Immersive VR Education公司专注于虚拟现实与教育的结合,其设计的“阿波罗 11 号VR”可以让学生真正沉浸在太空教育场景之中。国内如百度、网易等互联网头部公司也在积极布局“人工智能+教育”,未来将带动教育产业实现颠覆性变革。
当前,人工智能等技术发展的进程不断加快,并且已经从“管理”个人上升到助力“管理”城市。智慧城市是以物联网、云计算、人工智能技术等为基础的智能化城市形态。智慧城市的建设,是一项民生工程,最终目标是惠民利民,让全体市民共享高效便捷的公共服务和智能优质的城市生活。人工智能的加持,对城市服务水平的提升,以及城市各项功能、措施的完善起到了积极的推动作用。
随着城市化进程的不断加快,各种交通问题凸显。目前,人工智能在交通管理方面的应用主要有实时分析城市交通流量、智能分析公众资源数据、智能实时检测违法车辆等。例如,人工智能驱动的智能交通信号系统能够根据实时交通状况决定交通灯信号,优化城市道路网络中交通流量;人工智能算法能够根据城市居民的出行生活偏好数据为城市规划,尤其为公共交通基础建设提供指导;通过整合图像处理、模式识别等技术实现对城市全部交通网络的实时监控,提高交通执法效率等。
除了交通领域外,人工智能也应用于大气污染、水污染、垃圾污染等的城市问题治理中。借助人工智能技术建设智慧城市,能够有效改善人们的生活方式,创造美好生活和环境,推动城市的发展与创新。各国政府都在积极探索通过人工智能等技术的应用,推进政府职能转换升级,提升监管能力和公共服务水平,进一步发挥信息技术对经济调节、市场监管、公共服务的作用,达到提高政府管理效率、降低综合成本的目标。
人工智能已应用在社会治安、反暴反恐、灾害预警、灾后搜救、食品安全等公共服务领域,通过人工智能可准确地感知和预测社会安全运行的重大态势,提高公共服务精准化水平,保障人民生命财产安全。从应用的深度和广度来看,全球人工智能在公共服务领域还处在探索期。
相对来说,在社会治安领域的人工智能应用较早且具有较大需求。目前,人工智能已广泛应用于警方侦查过程,为警方破案提供重要线索。依托安防行业的基础,犯罪侦查成为人工智能在公共安全领域最先落地的场景。基于计算机视觉技术在公共场所安防布控,可以及时发现异常情况,为公安、检察等司法机关的刑侦破案、治安管理等行为提供强力支撑。美国多地警方部署人工智能警务风险评估软件,将犯罪控制在萌芽状态。智能软件根据保存的犯罪数据预测哪些犯罪高发区域可能会出现新问题等。人工智能系统可以根据全市治安摄像头的大数据实时分析辖区内的治安状况,一旦发现某处出现人员长时间聚集或打架斗殴事件,系统可以第一时间预警,并自动调配警力前往事发地点。另外,美国建立的禁飞系统能预测恐怖袭击的可能性,大数据系统每天都会传输犯罪预测数据到执勤警员的电子设备中,有效保障城市安全。
此外,在灾后救援领域,人工智能在高效处置灾情、避免人员伤亡方面发挥关键作用。不管是自然灾害之后的搜救,还是日常救援行动,随着人工智能融合,可快速处理灾区航拍影像,并借此实时向救援人员提供重要的评估与规划性指导,不仅保障自然环境、群众生命财产安全,同时能够最大限度地减少救援人员的牺牲。例如,日本总务省消防厅推进开发的“机器人消防队”由空中拍摄现场情况的小型无人机、收集地面信息的侦察机器人、可自动行走的水枪机器人等组成;美国国家航空航天局(NASA)推出的人工智能系统Audrey,通过消防员身上所穿戴的传感器,获取现场关键信息进行分析,最大程度上保护消防人员安全。
借助人工智能技术,能够有效提升金融机构的服务效率,实现金融服务的智能化、个性化和定制化。目前,人工智能已被广泛应用到银行、投资、信贷、保险和监管等多个金融业务场景,传统金融机构、大型互联网公司和人工智能公司纷纷布局金融业务方面,智慧银行、智能投顾、智能投研、智能信贷、智能保险和智能监管等是主要应用,分别作用于银行运营、投资理财、信贷、保险和监管等业务场景,但整体来看人工智能在金融领域的应用尚不成熟。
人工智能应用于金融科技并不是简单地取代金融从业者的工作,而是通过人工智能核心技术作为主要驱动力,为金融行业的各参与主体、各业务环节赋能,实现产品创新、流程再造、服务升级。从国内外的实践来看,人工智能推动了金融服务数据化、智能化和普惠化,几乎所有的金融机构都开始尝试人工智能技术来降本增效,典型场景包括智慧银行、智能网点、智能营销、智能客服、智能风控、智能安防、智能巡检、智能支付、智能监管、智能投资顾问等。
目前,应用在金融领域的人工智能相关技术主要包括机器学习、生物识别、自然语言处理、语音识别和知识图谱等技术。应用场景还处于初级阶段,大部分是人机结合式的,人工智能技术对金融业务主要起辅助性作用。不过,人工智能技术在金融业务场景中具有很强的创新潜力,我国的互联网头部公司如阿里巴巴、腾讯、京东等几乎全部搭建了智能金融平台。从长远来看,一方面,金融机构应用人工智能技术提升合规效率和降低合规成本;另一方面,金融监管机构应用人工智能技术提升监管能力和监管效率。
随着人工智能、物联网等新兴技术的不断发展,以及人们对于生活质量更高的要求,智慧家庭的概念应运而生。智慧家庭就是利用相关技术让各种家居设施为人们提供智能服务的居住环境,这些技术包括互联网、物联网、无线网、人工智能、大数据和云计算等,据此建立一个安全舒适、高效智能的家庭网络和服务系统。人工智能在家居领域的应用场景主要包括智能家电、家庭安防监控、智能家居控制中心等,通过将生物特征识别、自动语音识别、图像识别等人工智能技术应用到传统家居产品中,实现家居产品智能化升级,全面打造智慧家庭。
智慧家庭的理念最先出现在国外,如美国Verizon推出的Digital Life提供家庭监控、云平台的移动医疗服务;德国电信引入了Qivicon平台,提供相对完善的智能家居服务;日本的NTT推出的Home ICT计划,着力于创建安全家庭生活等。近年来,国内也有越来越多的公司开始布局智慧家庭,包括传统家电厂商、电信运营商、地产公司和互联网公司等,其中互联网科技公司的研发应用相对广泛,如科大讯飞与中兴微电子研发的智慧家庭语音识别系统、阿里巴巴与美的集团建立的开放式智能家居操作系统等。
智能家居产品已发展相对成熟,未来的市场发展空间较大。在智能家电终端产品方面,通过图像识别、自动语音识别等人工智能技术实现冰箱、空调、电视等家用电器产品功能的智能升级,促进家用电器控制智能化、功能多元化,提升家用电器的使用体验,如澳柯玛与京东联合研发推出的智慧大屏互联冰箱、长虹推出的Alpha人工智能语音空调等;在家庭安防监控方面,基于图像识别、生物特征识别、人工智能传感器等技术实现家庭外部环境监测、家庭门锁控制、家庭内部环境探测等功能,如LifeSmart与英特尔合作打造的人脸识别可视门锁、斑点猫的智能猫眼产品等。
互联网正在从社交网络发展为智能网络,未来的互联网不再仅仅是信息与人构成的网络,而是涵盖信息、人、产品、服务的万物互联的智能网络。只有把虚拟现实、增强现实、算法推荐、机器新闻、新闻游戏、大数据等前沿技术置于人工智能及智能网络的背景下,才能更深刻地认识和理解这些前沿技术对新闻媒体的影响,帮助新闻媒体更有效地把握和运用这些技术。从这个层面看,与其说人工智能技术是以上技术的聚合体,不如将人工智能技术视为下一代新闻媒体的生态环境,人工智能技术不仅会改变媒介产业价值链上的各个环节,还会重塑新闻生产的整个业务流程,人工智能技术在与新闻媒体结合的过程中具有广泛的应用领域和想象空间。
近年来,世界范围内主流媒体纷纷在人工智能领域进行了诸多有益探索,一些研究成果也已经在新闻生产制作的各个环节投入应用。从写作机器人到智能新闻采编系统,从AI虚拟主播到生物传感器新闻,人工智能技术及其发展理念已经渗透在新闻传媒业的各个方面,甚至主导着未来媒介市场的竞争格局。当前,美联社、路透社、纽约时报等世界强势主流媒体普遍将“采编流程智能化”作为新闻主业与人工智能技术结合的重要切口和聚焦点。
从国外强势主流媒体的人工智能发展态势看,对于采集端的智能化探索成为最为突出的重点领域,相关智能系统或产品的研发也最多,这其中也蕴含着从大数据(Big Data)到深度数据(Deep Data)的理念发展。相较于西方强势主流媒体的智能化方案,国内各大主流媒体、新兴媒体也纷纷进行了有益探索。从移动互联网到人工智能,国内传统主流媒体往何处走、何处去,“人工智能+媒体”被普遍认为是弯道超车、变线超车的最后的时间窗口。面对人工智能即将带来的颠覆性变化,互联网变局和重组的可能性正在孕育,这既是机遇,也是挑战。在这种背景下,国内各主流媒体纷纷从多个角度、多个领域开展人工智能的实践尝试,其中很多产品在进行重大主题报道时都发挥了重要的作用。
习近平总书记指出,“要探索将人工智能运用在新闻采集、生产、分发、接收、反馈中,全面提高舆论引导能力”。中宣部、广电总局等六部委印发了《关于促进文化和科技深度融合的指导意见》的通知,对新闻单位媒体深度融合方向作出了指导。按照习近平总书记要求和国家战略部署,新闻传媒业与人工智能的结合使得更有价值的新闻传播资源被释放出来,人工智能不仅重塑新闻生产的整个流程,还将改变传媒业态。从西方强势媒体的发展态势看,人工智能在媒体行业的落地更多集中于产品级、工具级,更复杂、更全面的架构乃至以大数据和人工智能为核心的技术生态体系尚处于探索阶段,未来人工智能在传媒业的应用还有更广阔的探索空间,我国的国家级主流媒体应当充分利用资源优势真正从体系化、制度化层面探索改革,逐步构建真正智能化的新闻传播生态链。
传统的新闻生产和加工模式主要以职业媒体人为主体,通过媒体人实地采访、辅助电话网络等方式获取新闻线索,再进行新闻内容生成和产品加工。随着“万物皆媒”趋势在媒体领域的逐渐深入,以物联网为载体、人工智能技术为支撑的新闻生产和加工模式逐渐替代传统的单一模式,合理利用大数据背景下的海量信息内容,使得新闻内容生产和加工模式呈现出精准化、智能化和多元化的新特点。人工智能技术在媒体内容的生产和加工领域的应用主要体现在以下方面:
——全媒体信息采编系统。 全媒体时代,媒体资源的形式日益多样,但各种资源存储相对分散,难以共享、互通,稿件传输渠道过多且分散,缺乏有效的统一管理,这些都是严重制约媒体融合发展亟待迫切解决的问题。全媒体信息采编系统综合运用人工智能、大数据、云计算等前沿科技,能够实现对所有媒体资源的高度整合、集中管理以及统一调度分发,突破了以往时间、空间、设备等对媒体信息采编的约束,形成了全天候、实时高效的信息采编体系。全媒体信息采编系统融合了音视频处理、语音识别和人脸识别等的人工智能技术,通过收集普通群众、新闻记者、智能机器人、传感器等上传的图片、文字和音频三个维度的信息,使得新闻编辑人员能够快速获取新闻线索,减少了新闻信息采集、整理、传递过程中耗费的时间和人力资源,极大地提升了采编效率。第一代的全媒体信息采编系统强调“大而全”,借助计算机技术完成相对全面的信息搜集和整理,而新一代的系统强调“全而深”,不仅要搜集到全面的数据,更需要“消化”分析数据、“挖掘内幕”、产生高附加价值的内容,实现真正“智能化”的突破。
——新闻写作机器人。 新闻写作机器人已经是传媒业较为成熟的智能化应用,主要依赖于人工智能处理、数据挖掘和分析,以及高质量的新闻媒体数据库,更多应用于体育赛事报道、财经证券报道、气象气候报道等“格式化”的新闻播报。这类新闻内容单调简单,没有涉及深层次的分析评论,注重新闻的时效性和准确性,报道风格不追求个性化,能够根据新闻媒体数据库设计新闻模板将新闻内容嵌入其中,快速智能填充生成新闻报道。然而机器人填充式写作并不适用于逻辑性复杂和叙事性强的社会、政治、经济、文化报道等,人工智能如何在该类型新闻媒体领域融合仍然是研究难点。
——新闻现场全景式报道。 VR(虚拟现实)和AR(增强现实)技术与新媒体的不断融合,使得整个新闻内容生产模式发生了重大转变,一种同时结合时间维度和空间维度对新闻事件进行播报的新闻现场全景式报道应运而生。这种全新视觉的播报方式打破了传统媒体以文字、图片、视频为主的二维平面新闻生产模式,呈现出全方位、多视角、立体化的全景式新闻生产模式,新闻生产模式由静态过渡到动态。用户在沉浸式体验全景式新闻报道的同时,由新闻事件的旁观者角色逐渐向新闻事件的体验者角色转变,人工智能VR和AR技术的引入使得用户的参与感更强,用户可以根据自己个人偏好选择新闻观察角度,形成个性化的报道感受和体验。
推荐系统根据推荐算法的不同可以分为基于内容(Content-based)的推荐系统、协同过滤(Collaborative filtering)推荐系统以及混合型(Hybrid)推荐系统三大类,值得注意的是在现今的个性化推荐系统技术之中,又出现了基于知识的推荐算法。基于知识的推荐系统在某种程度上可以看作是一种推理技术,它能很好地利用用户需求信息推理出用户可能会喜欢的物品。基于知识的推荐系统优点是:相比于其他推荐技术,具有更好的解释性(Explainability),它能够挖掘一些额外的知识来产生推荐等,但在当今网络中的现实应用非常之少。
——基于内容的推荐系统。 基于内容的推荐方法的理论依据主要来自于信息检索和信息过滤,所谓的基于内容的推荐方法就是根据用户过去的浏览记录来向用户推荐用户没有接触过的推荐项。内容过滤主要采用自然语言处理、人工智能、概率统计和机器学习等方法进行过滤。基于内容的推荐方法可以分成两类:启发式的方法和基于模型的方法。启发式的方法就是用户凭借经验来定义相关的计算公式,然后再根据公式的计算结果和实际的结果进行验证,然后再不断修改公式以达到最终目的。而基于模型的方法就是将以往的数据作为数据集,然后根据这个数据集来学习出一个模型。
基于内容过滤的系统其优点是简单、有效,通过使用用户和项目的描述文件,可以较好地解决冷启动问题;由于不需要用户的评分数据,因此可以不受评分数据稀疏性的约束;通过列出推荐项目的内容特征,可以解释推荐的原因,非常直观。其缺点是特征提取的能力有限,过分细化,纯基于内容的推荐系统不能为客户发现新的感兴趣的资源,只能发现和客户已有兴趣相似的资源。这种方法通常被限制在容易分析内容的商品的推荐,而对于一些较难提取出内容的商品,如音乐电影等就不能产生满意的推荐效果;无法找出与过去经历有所不同且具有意义的推荐,这是由于单纯对项目做处理,用户只能接收到与过去经历相类似的推荐项目,这样便失去了许多潜在推荐的可能性;对于内容品质、设计风格或使用者观点等等,基于内容的推荐系统由于是针对内容,所以无法处理。如果遇到同名的两样物品若是有两种不同本质的情况时,基于内容的推荐技术并没有有效的分别方法。
——协同过滤推荐系统。 协同过滤技术是推荐系统中应用最早和最成功的技术之一,协同过滤方法不需要事先获得用户和项目的特征,它们只依赖于用户过去的行为(购买、评分、浏览、页面驻留时间等),以评分的形式收集用户对物品的反馈,接着计算用户之间的相似度,然后利用与目标用户相似度较高的邻居对其他产品的评价,来预测目标用户对特定项目的喜好程度,最后系统根据这一喜好程度对目标用户进行推荐。
以使用者的角度来推荐的协同过滤系统有下列优点:能够过滤机器难以自动内容分析的资讯,如艺术品、音乐等;共用其他人的经验,避免了内容分析的不完全或不精确,并且能够基于一些复杂的、难以表述的概念(如个人品味等)进行过滤;有推荐新资讯的能力,可以发现内容上完全不相似的资讯,使用者对推荐资讯的内容事先是预料不到的,可以找到使用者潜在的兴趣偏好;推荐个性化、自动化程度高,能够有效地利用其他相似使用者的反馈,加快个性化学习的速度等。与传统文本过滤相比,协同过滤有下列优点:能够过滤难以进行机器自动基于内容分析的信息,能够基于一些复杂的、难以表达的概念(如信息质量等)进行过滤,推荐的新颖性等。协同过滤系统在商业领域被广泛应用,大多数电子商务网站都采用了协同过滤技术来提高服务质量。
虽然协同过滤作为一种推荐机制有其相当的应用,但协同过滤仍有冷启动、稀疏性、系统扩展性、推荐实时性等问题需要解决。
——混合型推荐系统。 混合型(Hybrid)的推荐系统吸收了基于内容的推荐系统和协同过滤的推荐系统的优点,并改进了它们各自的缺点。
关于如何组合这两种推荐方法,理论上存在多种方法,但不同的组合思路适用于不同的实际应用场景。组合思路大致可以分为三类:后融合、中融合和前融合。后融合是指融合两种或两种以上的推荐算法各自产生的推荐结果,如使用基于内容的推荐算法和协同过滤推荐算法分别得到各自的推荐列表,融合列表的结果决定最后所推荐的物品。中融合是指以一种推荐算法为框架,融合另一种推荐算法,如以基于内容的推荐算法为框架,融合协同过滤的算法;或者以协同过滤算法为框架,融合基于内容的推荐算法。前融合则是直接融合各种推荐算法,如将基于内容和协同过滤的算法整合到一个统一的框架模型下,再生成推荐列表。
随着网络环境的越来越复杂,仅仅简单地使用基于内容的推荐系统和协同过滤的推荐系统越来越难以满足真实环境中的用户需求。在现实生活中,用户的需求往往多种多样,为了满足这种需求,现在各个大型网站也都开始构建混合型的推荐系统,如亚马逊网络商店部署的推荐系统不仅有简单的协同过滤技术,还包含了多种个性化推荐服务及热门商品推荐等服务。
多媒体技术的快速发展使得传统的传媒业务日新月异,同时,新形式的内容交互与体验技术逐渐被应用到各大领域,悄无声息地改变着城市的信息化生活。其中,内容交互与体验相关的应用主要有如下三个方面:
——自动播报。 基于人工智能技术的自动播报并非是简单的将媒体文字转换为语音的形式,它旨在制造一个基于算法的模型,用于识别文字中需要转化成广播格式的元素。目前,自动播报功能在人工智能技术的催化下开始发展起来。西方主流媒体如美联社等利用人工智能技术进行智能播报,将篇幅短、语言简洁、数据翔实的新闻文字自动转换为广播版本,让文字到广播的自动化转化达到不需要人工编辑和审校即可发布的水准。目前,基于人工智能技术的自动播报已在传媒应用中拥有相当可观的发展成效,如通讯领域、教育领域等都有它的身影。未来,自动播报技术也将涉足于医学、城市建设等更多领域。同时,与自动播报技术相关的重要算法模型也必将吸引更多的科研人士前来研究,共同促进这项技术的发展。
——手语合成。 手语合成技术给需要进行手语学习的人群带来了很多便利,其通过对用户的语音进行智能化识别,以手语视频的形式将识别结果展示在屏幕上,该技术为需要学习使用手语的用户或者想与聋哑人进行交流的用户带来了大大的便捷。手语合成技术的实现离不开语音识别模块、文字分词模块、视频合成模块、视频录制模块的支持。其中,语音识别与视频合成模块与人工智能技术息息相关。手语合成方式主要有基于虚拟人和视频拼接的方式。基于虚拟人技术的手语合成是丰富智能人机接口的需要,通过大型计算机处理从而实现数字化虚拟人体;基于视频拼接的手语合成使用由真人演示的手语视频,在视频片段间寻找最佳拼接点,并插入过渡帧,从而实现手语动画的合成。尽管手语合成技术的出现使得聋哑人与健听人之间的对话已经成为可能,但“听懂手语,看懂声音”的完全实现还须解决大量技术难点,包括手语多模态表达的复杂性、多维手语运动数据识别、手语运动数据的重定向、手语运动数据获取不完整及大词汇量和非特定人的识别等。未来,手语合成技术的研究将致力于为用户提供更高稳定性、新颖和更加人性化的服务。
——有声合成播报。 有声合成播报可将用户输入的文字转换成自然的语音输出,并且可以支持音量、音调及语速等功能的设置,打破了传统文字式人机交互的方式,让人机沟通变得更加自然。目前,语音合成技术不断向前发展,同时,参数合成、拼接合成两条主要的技术路线都取得了长足进展,它们相互竞争、相互促进,从而使得合成语音的质量有了大幅度提升,使得语音合成技术在众多场景中也得以应用。随着人工智能技术的发展,语音交互将更加火热,特别是深度学习技术对合成技术的巨大影响,必将使得语音合成技术在语音导航、信息播报、阅读教育、泛娱乐等众多领域拥有更广阔的应用前景。
近年来,自媒体平台在移动互联网技术的加持下日益成为了新闻生成和发布的新型互联网渠道并深受年轻人的喜爱。但是其上的有害内容识别、监控和过滤工作长期依赖于人力资源,造成了严重的滞后和遗漏。虚假消息往往已经造成严重的社会影响之后,才会被发现和控制。利用人工智能技术,可以对海量信息实现毫米级别的监控识别,极大地提升了有害内容的识别率,并可以根据预定的处理方案,有效地过滤和替代相关信息的传播。此外,人工智能技术还可以被用来检测版权、内容抄袭及侵权问题等,保护新闻媒体工作者的权益。
——有害信息识别。 有害信息种类繁多,包含政治敏感信息、涉恐涉暴信息、色情信息、歪曲事实信息等,并且常常以多种形态展现(图像、视频、音频、文字或者它们的结合)。因此,有害信息识别是一个典型的异构大数据智能应用,极具挑战。传统的解决方案主要有三种:一是纯人工审核,靠人眼鉴别该图片或视频是否违规,费时费力;二是建立违规图片、视频的MD5 数据库,避免有害内容的重复分享,但是对于内容稍作变化的变种则无能为力;三是传统的智能审核,通过图像、视频的颜色内容建模,对图像进行切割和分类,准确率不高。最新的人工智能方法则是分别建立面向视频、音频、文本的不同识别模型,通过大量内容的训练,模型自动抓取出有害信息的特征,并根据上下文环境,能够自适应地判别和监测。
——新闻版权检测。 近年来,新闻内容除了人为进行的抄袭和侵权问题,人工智能内容自动产生所造成的侵权问题也越发严重,这给新闻媒体工作者造成了极大的困扰和损失。人工智能训练中使用他人作品、人工智能创作中不合理“借鉴”他人作品或其他人工智能创作物、自然人抄袭人工智能创作物等行为层出不穷。此外,有关人工智能编创过程中的著作权问题也浮现出来,如人工智能产生的图片、文字是否构成著作权法保护的“作品”,这些“作品”所创造的商业价值及其可能的侵权责任归属问题等。包括我国在内的很多国家致力于在现有著作权法体系框架内, 通过完善法律解释, 将人工智能生成物纳入著作权客体保护范围, 明确其归属, 并通过已有的著作权法制度来纠正人工智能技术在编创过程中可能出现的新问题。