摘要:当前,人工智能处于快速发展期,已从计算智能、感知智能发展到认知智能阶段,其在金融领域应用的深度和广度不断拓展。在数据、算法和算力三要素具备的基础上,计算机视觉、语音识别等感知智能技术广泛应用,自然语言处理、知识图谱等认知智能技术逐步落地。多模态信息的融合处理、分布式模型学习、跨领域迁移学习等成为人工智能发展的热门方向,算法模型的可解释性得到关注,治理原则进一步完善。随着人工智能商用成熟度的不断提升,智能金融新业态正从单一产品应用向综合解决方案演进,其价值创造也由以降本增效为核心朝提高客户满意度方向发展。
关键词:人工智能 多模态学习 联邦学习 智能金融
继2017年人工智能上升至国家战略后,已连续三年写入《政府工作报告》,国家出台了一系列相关的总体布局、区域规划、产业政策和治理原则,为人工智能技术的快速发展和应用提供了利好环境。
2019年3月,中央全面深化改革委员会第七次会议审议通过了《关于促进人工智能和实体经济深度融合的指导意见》,强调市场导向和产业应用,构建“数据驱动、人机协同、跨界融合、共创分享”的智能经济形态。
在区域规划方面,科技部、工信部分别支持建设人工智能创新发展试验区和人工智能创新应用先导区,旨在创新体制机制,发挥先行先试作用,形成一批可复制的人工智能创新发展典型模式,促进人工智能技术的应用推广和产业化。目前,北京、上海、天津、深圳、杭州、合肥等多个城市获批建设人工智能创新发展试验区,上海(浦东新区)、济南-青岛、深圳等区域获批建设人工智能创新应用先导区。
在产业政策方面,2019年8月,科技部印发《国家新一代人工智能开放创新平台建设工作指引》,鼓励人工智能细分领域的领军企业整合技术资源、产业链资源,搭建开放、共享平台,输出人工智能技术研发能力和基础设施服务能力。目前,已有15家企业入选,涵盖自动驾驶、城市大脑、医疗影像、智能语音、智能视觉、基础软硬件等多个领域。其中,在金融领域,以普惠金融为代表的中国平安成功入选。
在治理原则方面,2019年6月,国家新一代人工智能治理专业委员会发布《新一代人工智能治理原则——发展负责任的人工智能》,提出了“和谐友好、公平公正、包容共享、尊重隐私、安全可控、共担责任、开放协作、敏捷治理”八项原则,以更好地协调人工智能发展与治理的关系。此外,中国人工智能产业发展联盟提出了签署《人工智能行业自律公约》的倡议,从行业组织角度推动人工智能相关企业自律发展。
人工智能技术催生的“智能+”不仅带来了各行业的深刻变革,而且成为经济增长的新动能。2019年我国人工智能市场规模预计将达到760亿元 ,增幅达35.71%(见图2-1),在安防、金融、营销、客服等场景快速渗透,进入规模化应用阶段;在医疗、零售、交通、制造等场景逐渐发力,激发应用价值潜力。截至2019年5月,我国人工智能企业共计1093家 ,近80%的企业分布在北京、上海、深圳和杭州,四座城市完善的人工智能产业链带来了明显的集聚效应。
图2-1 2018~2022年我国人工智能市场规模及其增长率
注:2019~2022年为预测数。
资料来源:易观:《2019年中国人工智能应用市场专题分析》,2019。
IDC调研结果显示,人工智能的市场接受度从2017年的10%提升至2019年的45% ,多数未使用人工智能技术的企业计划在未来1~2年内部署,大部分已使用人工智能技术的企业计划在未来2年增加至少1倍的投资,人工智能的发展空间和潜力巨大。
随着大数据、云计算、物联网等多种新兴技术的快速发展,人工智能广泛应用的基础支撑环境不断改善。2019年,5G技术进入商用时代,助推物联网进一步发展,各类场景的数据总量持续爆发式增长,为人工智能训练模型提供了丰富的数据资源。同时,越来越多的人工智能训练任务使用大量模拟数据来解决某些场景下训练数据较少的难题,从而提升了人工智能训练结果的精准度。
作为当前人工智能领域最有效的机器学习算法,深度学习以大量的、标记化的训练数据为基础。为拓展人工智能技术的应用场景,越来越多的以少量、非标记化数据为特征的算法模型不断推陈出新,降低了对标记化数据的依赖性和为此投入的大量人力资源。而自动机器学习(AutoML)的逐步应用,也降低了机器学习算法的使用门槛,提高了人工智能应用的普及率。
强大的算力支持是人工智能技术大规模应用的根本保障,遭遇瓶颈期的传统人工智能算力正向云端和边缘端扩展。基于云计算的人工智能即服务(AIaaS)和基于边缘计算的各种人工智能专用芯片不断涌现,形成了云端训练、云端推理、边缘推理等更灵活、更具效益的人工智能应用部署方式。
我国企业和研究机构高度重视人工智能技术的创新发展和学术研究,在专利申请和论文发表方面均取得了巨大的成就。自2010年以来,我国申请人工智能专利数量的增长速度明显加快。截至2019年10月,我国人工智能专利申请量累计达44万余件 ,超越美国成为人工智能专利申请量最多的国家。百度、腾讯、国家电网、中国科学院、清华大学等主要专利权人不断积累技术储备,在人工智能领域提升全球竞争力。
目前,我国在人工智能领域发表的学术论文数量已超过美国,论文质量和引用指标迅速提升。根据艾伦研究所的分析,人工智能领域引用次数前1%的论文,也就是具有最高影响力和学术价值的顶尖论文,中国所占比例快速提高,迅速缩小与美国的差距。
近年来,我国人工智能行业的融资事件数量不断增加,融资规模持续扩大,预计2019年将出现首次回落,行业泡沫减退,资本更趋理性。平均融资规模总体呈现跨越式增长,从2014年的0.65亿元增加至2019年的2.27亿元 ,资金更多流向头部企业,独角兽企业和成长期项目融资热度不减,人工智能早期项目融资难度有所增大。
从投融资事件地域分布看,北京、深圳、上海已成为我国人工智能行业发展的核心区域,带动京津冀、粤港澳大湾区、长三角经济区的人工智能技术快速发展,并影响全国。从投融资事件细分领域看,行业资本因其逐利特征更多流向人工智能各类应用场景,人工智能基础技术研发所受重视程度依然不足。
目前,我国人工智能领域的人才供应严重短缺,相关学科的高级人才培养和大众普及教育刚刚起步。2019年3月,教育部公布了2018年度普通高等学校本科专业备案和审批结果,全国21个省(自治区、直辖市)共计35所高校获得首批人工智能专业本科建设资格。此外,还有众多高校新增机器人工程、智能科学与技术、智能制造工程、智能医学工程等专业,也均与人工智能相关。
在普及教育方面,人工智能课程开始试点进入中小学课堂,以感受和体验为主,仍在探索科学可行的实施路径,存在教学标准缺失、师资力量匮乏、课程体系不完善等问题,缺少人工智能教育的科学观和方法论。
全球主要经济体高度重视人工智能发展,加快进行人工智能中长期战略规划,各国纷纷将人工智能提升至国家战略,力争在全新科技竞争中占据主动,基础设施、公共数据集、伦理法律、国际治理等成为各国布局人工智能的共同关注点。
2019年2月,美国总统特朗普签署行政令,启动“美国人工智能倡议”,从国家战略层面优先考虑投资人工智能研发,以“维持美国在人工智能领域的领导地位”。2019年6月,美国更新了《国家人工智能研究和发展战略计划》,突出了投资人工智能研发的主要优先事项,在原有七大战略的基础上更新为八大战略,新增扩大公私合作以加速人工智能发展。人工智能不仅成为美国政府预算和规划中的优先事项,而且成为中美国家竞争、贸易摩擦的角力点之一。2019年10月,美国商务部将28家中国企业加入“实体管制清单”(Entity List),禁止这些企业购买美国产品,其中包括8家人工智能技术公司。
为推进欧洲在人工智能领域形成合力,欧盟理事会于2019年2月审议通过《关于欧洲人工智能开发与使用的协同计划》,促进欧盟各成员在投资、数据、人才和信任四个方面加强合作,共同面对人工智能技术发展带来的机遇和挑战。欧盟重视人工智能发展的伦理道德和法律框架,于2019年4月发布《人工智能伦理准则》,坚持以人为本、值得信任的人工智能发展理念,提出了人的能动与监督、安全可靠、隐私保护、透明公平、社会福祉、可追责等关键要求。
2019年,英国、阿拉伯联合酋长国等国家更新各自的人工智能战略规划,俄罗斯、韩国、荷兰、丹麦、西班牙等国家纷纷制定或发布人工智能国家战略。5月,经济合作与发展组织(OECD)的36个成员以及阿根廷、巴西等42个国家通过了一项人工智能指导原则,以规范各国研发和应用人工智能的行为。在6月举行的G20数字经济部长级会议上通过了《G20人工智能原则》,对促进建立可信人工智能的知识共享与国际合作产生了积极影响。
随着金融科技的快速发展,人工智能等先进技术在金融领域获得了广泛的运用,推动了业务创新和业务模式的变革。特别是在计算机视觉、语音识别、自然语言处理、知识图谱等方面智能技术的研究和进展,使得人工智能在智能客服、智能运营、智能服务、智能营销、智能风控等领域广泛应用,并在其服务流程和服务模式创新中发挥了较大作用,极大地推动了这些领域向智能化方向发展。
计算机视觉研究的最终目标是让计算机视觉系统具有人类视觉的能力,甚至超越人类视觉的效果,使其更加敏锐地观察和理解世界,不仅能够清晰细致地看清动态的图像内容,而且能够理解动态场景,还可以进行实时处理,并做出相应的态势预测。当前重要的进展之一是理解复杂图像所蕴含的含义,对其理解和描述是一个融合计算机视觉、自然语言处理和机器学习的综合过程,其目标是对一幅复杂图像进行视觉输入,分析理解其中所代表的含义,并转化为一段文字描述,在方法上主要采用层次化的卷积神经网络模型和启发自认知模型,进行图像层次化的关系识别,然后采用递归神经网络的编码器、解码器等主要模型进行类似自然语言翻译的过程,形成图像含义的描述。
基于计算机视觉的场景理解取得重要进展。场景理解是通过获取场景的层次结构及各类要素,分析场景所处的变化情况,感觉周围环境要素的变化趋势,进行语义推理,实现态势感知。其采取的主要方法为,利用社会-长短记忆网络(Social-LSTM)实现环境主体要素之间的状态联系建模,结合各自历史运动轨迹,推断在时间约束、空间约束等条件约束下,在即将到来的时间内分析预测其环境要素的运动走向或变化趋势,从而不仅能够感知环境要素的当前行为,而且能够预知环境要素即将发生的动态变化,让计算机视觉主体提前采取相关的行为或措施进行应对。
语音识别就是让计算机能够识别、听懂人类的讲话,其技术就是将语音信号转换成相应的文本或者指令,让计算机理解和识别人类语音。语音识别技术广泛应用于多个领域的自动客服、自助语音翻译、指令控制与交互等场景。当前,语音识别技术在理论和应用方面取得关键突破,其发展如火如荼,在各类生产生活场景中获得广泛应用,特别是在金融领域,语音识别在智能客服、智能交互、语音身份验证等方面取得了较好的应用效果。语音识别技术主要包含预处理、特征提取、声学模型处理、解码输出等过程,其主要原理是,对语音进行声学预处理,基于语音特征参数的模式识别,通过不断地训练和学习,将输入的语音分帧按相关模式进行分类,根据分类的情况,找到最佳的匹配效果,并进行解码输出。
当前语音识别技术在单纯的环境中识别率已经达到95%以上,但在嘈杂的环境中识别率会明显下降,如何去掉嘈杂的环境背景音,是当前语音识别的重要研究内容。2019年有关研究提出了深度对抗声学模型训练框架,该框架由生成器、判别器和分类器组成。生成器用来将带噪语音数据分布变成纯净语音,判别器用来判定语音信号是否来自纯净语音训练集,分类器指导生成器提取分布特征。生成器、判别器和声学模型进行联合对抗训练,三者相互密切配合,突出真实语音的特征,有效地提高了声学模型的鲁棒性。
自然语言处理是指通过相应的模式和方法,对语言的逻辑进行相应的处理,包括对词、句、篇章的输入、识别、分析、理解、生成、输出等的操作和加工过程。自然语言处理和理解是人工智能、计算机科学和语言学交叉领域的一门重要学科。自然语言理解分析是一个复杂的过程,当前主要对其进行模型化、层次化处理,共分为5个层次,即语音分析、词法分析、句法分析、语义分析和语用分析。在实际应用中,由于其千变万化的语言文本以及对话各种语境的不同语义,各种用词存在广泛的多义性或歧义性,有时要根据上下语境来确定语言的具体含义,因此在技术处理方面的难度非常大,特别是有效地学习、准确地理解和分析相关信息之间的关系显得格外重要。为了较好地解决这些问题,在多模态词汇表示模型、大规模关系抽取、时间检测和事件识别等方面取得了相关进展。
相较于文本的模型,多模态模型可以进行更好的词汇表示。由于不同模态的信息对不同类型词汇的贡献度不同,因此当前研究提出动态融合机制,可以分别针对词类和词汇,对其不同模态赋予不同的权重,以便加以区分,建立动态多模态模型,利用相关或相似词汇作为弱监督学习信号,让模型在学习相关或相似词汇的过程中,通过动态融合的多模态机制,对不同类型的词汇赋予不同的权重,可以在较大程度上提高词汇识别、处理和表示的质量。
知识图谱本质上是基于语义网络而形成的知识库,即基于语义网络存在相互关联关系的集合,这些关系蕴含现实世界对象之间的关联。知识图谱一般从逻辑上可以包含多种类型的节点和多种类型的关联,这种多类型的节点通过相互不同类型的关系进行关联,从而形成复杂的网络结构,也就映射着复杂的现实世界。
为了构建知识图谱,通常用点来表示实体,用边来表示关系。例如,在现实中,实体可以表明一些具体的人、事物或抽象的概念;而关系则可以表达不同实体之间的某种关联,如某人和某人之间的关系是朋友、某人是某企业的股东等。因此,实体关系在很多场景非常适用,并适合用知识图谱来表示。例如,在一个社交网络知识图谱里,既可以有“人”的实体,也可以包含“公司”实体。人和人之间的关系既可以是朋友关系也可以是同事关系,人和公司之间的关系既可以是“现任职”关系也可以是“曾任职”关系。一个实体具有很多属性,并且具有各种各样的关系,从而可以全方位地刻画,通过关联和属性的刻画深刻地去描述世界。
当前构建知识图谱的主要流程分为实体识别、关系识别、实体归一、知识解析。其中,关键是需要大量的信息和属性进行刻画,这就需要收集不同维度的丰富的信息和数据。对于一个成形的知识图谱来说,其数据主要来源于两个方面:一是实体本身的数据,主要是实体日常行为数据或在交易中形成的数据;二是外部数据,主要是实体在维护社会关系和进行经营管理过程中,政府部门或第三方部门对市场进行管控而面向实体采集的相关公权数据。这些数据既有结构化的数据,也有大量非结构化的数据。对于非结构化的数据,可以按大数据的方法进行处理。知识图谱形成的关联图可存储在图数据库中,如Neo4j、Flock DB、AllegroGraph等,实现高效关联运算和复杂关系分析。
当前,人工智能处于快速发展期,已从计算智能、感知智能发展到认知智能阶段,其在金融领域应用的深度和广度不断拓展。在数据、算法和算力三要素具备的基础上,人工智能的发展趋势为多模态信息的融合处理、分布式模型学习、跨领域迁移学习等,同时追求模型的可解释性,使其在金融等重要领域取得更好的应用效果。
在现实世界中,模态存在的类型多样,如触觉、听觉、视觉信息等都是模态类型。在实践中,我们要基于多模态数据并在此基础上开展多模态机器学习,因此需要具备识别、分析和处理多模态信息的能力。通过获取多模态信息,进行信息协同处理和机器学习,实现多模态信息融合。
当前多模态的主要研究方向为多模态表示学习、模态映射、模态对齐、多模态融合和协同学习。多模态表示学习主要是将图像、语音、视频等所蕴含的语音信息转换、整合、抽象为实值信息的方法和过程。在多模态信息中,抽取被研究对象的特征,同时考虑到多模态信息的一致性和互补性,充分利用多模态之间的互补性,剔除多模态之间信息的冗余性,进行信息融合。模态映射是将一个模态的信息转换成其他模态的信息,其研究趋势是将计算机视觉和自然语言处理领域结合起来进行模态映射,以实现信息互补并且能够进行大规模处理,获取更加合理的视觉表述,如将语音和嘴唇动作进行结合,形成较好的语音处理方式。
联邦学习是2016年谷歌最先提出的,其主要设计目标是进行大数据交换时,在保障信息安全、个人隐私安全等合法合规的前提下,多个参与方或者计算节点之间开展联合、高效率的模型学习。随着联邦学习的快速发展,使用的模型不仅仅限于神经网络,还包括随机森林等学习算法,其主要发展趋势是基于人工智能协同计算和协作网络,解决节点之间的联合建模问题。
联邦学习的主要框架是联合训练学习模型,为保障数据的安全性、保密性,在使用联合训练学习模型前,采取公钥对样本数据加密之后进行分发,相互之间采用加密数据的模型进行训练,并将训练的结果发送给相关的联邦学习参与方。联邦学习参与方接到相关的训练结果之后,利用私钥对数据进行解密。因此,联邦最主要的是数据上的联邦,在训练交互过程中数据被隔离,相互之间不会被泄露,采取严格的方式保护了样本隐私数据安全。联邦学习参与方的地位平等,能够开展公平协作,在各方的共同努力下对信息和模型参数进行交换,使模型获得良好的优化。
联邦学习作为分布式的机器学习方式,能够较好地解决数据孤岛问题,让联邦学习参与方在数据安全的情况下开展联合建模,从技术上打破了数据孤岛,实现了人工智能的协作。当前的研究趋势主要是突破业务领域和相关网络的限制,优化分布式安全计算框架,突破连接边界,提供高性能的计算支持。在建模过程中,应研究成熟的学习范式,提高模型训练效率,提升模型质量,保护用户隐私,增强模型的健壮性和安全防御能力,更加关注安全和公平。推动联邦学习更加通用化、产业化和场景化,在不同的领域、不同的机构和不同的数据结构之间发挥作用。
在机器学习和深度学习的过程中,要对大量的数据或者训练资源进行标注,而在现实中大部分数据是没有标签的,从收集数据标签到构建一个模型,需要付出高昂的代价。此时需要对模型原来带有标签的数据进行重用,因而提出了迁移学习方法。迁移学习就是运用已有的知识来推测新知识,也就是找到已有知识和新知识之间的相似性,然后去认知新知识。在迁移学习中将已有的知识称作源域,要学的新知识称作目标域,源域和目标域不同,但有一定的关联。通过迁移学习,分析相关差异,利用源域已知的知识,对目标域的数据进行标注,从而解决了模型数据缺失标签的问题。
研究迁移学习的重要方向之一就是如何避免负迁移。目前大部分迁移学习是基于源域和目标域存在一定的相关性,一旦这个假设不成立,可能在实际应用中就会产生负迁移,其效果比不迁移还要差。为了避免负迁移的发生,源域和目标域可迁移性的方法值得深入研究。一种思路是通过相关途径进行适当的迁移测试,面向源域和任务抽取一定的知识,应用目标域进行适应性测试,获取相似性标准,进行相似距离的度量。当前迁移学习主要是基于有监督学习领域,随着深度学习在无监督和半监督领域的应用越来越广泛,在迁移学习发展领域,未来深度迁移学习算法将得到越来越多的关注、研究和应用。
机器学习模型的可解释性是要明确在建模型在决策过程中所做出选择的原因、程度,机器学习模型由具有多维特性的算法组成,算法试图从大数据中学习潜藏的模式、关系和规律,而无须依据相关的编码和固定的规则。因此,在实际表现中像是使用了一个黑盒,但在实际应用中特别是在金融业务领域,对决策过程进行解释,不仅要知其然,而且要知其所以然。可解释性对决策过程非常关键,目前在机器学习领域,可解释性是一个重要的研究方向,首先要理解机器学习模型的方法,其次要确定模型解释方法的标准,确定模型的解释范围。
机器学习模型的可解释性范围分为局部解释和全局解释。当前局部解释取得了一定的进展,全局解释是孜孜以求的方向。已有研究提出不可知解释框架模型可用于未知的局部解释,主要关注某个节点的特征变化,分析其影响周围局部区域其他节点的结果,从而获取局部特征空间的因果变化。全局解释试图理解模型的结构和各个组成部分如何发挥作用,以及模型的子集如何影响模型的决策。理解和解释整个模型,需要完整的模型结构、假设和约束知识,基于完整的数据集理解和解释响应变量与预测变量之间的特征交互和关联关系,但当模型在三维以上,理解其可视化特征就变得非常困难,因此是未来需要突破的重要领域。
在新科技的革命浪潮之下,人工智能快速发展,推动各行业转型升级、模式重塑和产品创新,成为产业发展和转型升级、支持供给侧结构性改革的重要技术。人工智能被广泛地应用于人类的各类活动场景中,正在深刻地改变人们的生产生活方式,提升人们的生活质量。但是,在实际应用中,人工智能和人的矛盾不能被忽视。人工智能内置自身的算法和规则,由于算法本身的复杂性,存在一些算法模型的运转过程不具有可解释性,难以说明结果是如何决策得出的,当其行为结果与人类法律规则或社会规范相冲突时,就会给人类的生产生活带来较大挑战甚至威胁,其挑战主要存在于以下几个方面。
技术失控的风险。在技术的发展史上一直存在技术控和技术失控二维逻辑主线的博弈关系,人工智能的发展将技术失控问题推到了一个新的高度。由于人的认知是基于一个局部环境获得最优,而人工智能和大数据技术的发展有可能将信息收集能力、学习和分析能力提升到一个全新高度,超越了人类认知的局限性,人类的规则、规范及道德是不可量化的领域,人工智能可能难以进行识别学习并融入自身规则,因此人工智能和人类之间存在人性上的差距,其缺乏主体性意识,难以真正像人那样带有温情地理解、感知和对创造力进行洞察。如果我们对人工智能算法的控制力或者想象力缺失,人工智能技术将会破坏人类规则,出现让人难以接受的结果和各种意外的情况。
信息安全方面的风险。在人工智能处理过程中,需要对大量的数据信息进行海量数据处理、深度融合和快速计算。这些数据涉及人类生产生活的方方面面,而且有些数据还相当敏感,这些重要数据信息一旦在处理过程中出现泄露,将会造成严重的后果。有些不法分子为了攫取不当的利益,采取各种手段和措施控制机器程序,注入木马病毒,实施盗窃行为,导致数据丢失泄露。同时,智能处理程序本身可能存在缺陷,被动地将相关信息泄露出去,这些信息一旦被网络不法分子利用,则会造成相当严重的后果。保证数据的机密性、完整性和可用性,必须在人工智能技术应用过程中引起高度重视。
伦理道德方面的风险。创新技术和伦理道德内在冲突反复,呈现在不同的发展阶段,只有处理好新技术与人和社会的关系,才会为人工智能发展营造一个良好的环境。人类对文化发展、社会环境和人工智能技术的认识具有局限性,有些算法是基于这些局限性而建立的,导致出现算法偏差和机器歧视,如在谷歌搜索中搜索黑人的名字更容易出现暗示具有犯罪历史的信息。同时,人工智能的发展使人类对机器虚拟环境越来越依赖,人的衣食住行、决策管理和组织协调越来越需要机器的支撑,“人际关系”在很大程度上被“人机关系”所替代,人类将产生严重的依赖性,从而可能产生异化危机。
虽然人工智能给人类带来了各种问题甚至难题,但我们不应反对技术本身,而应该深刻反思技术,技术发展最终会更好地为人类服务、为人类造福,要以风险预防为核心、以法律法规为主导、以价值实现为目标构建人工智能治理体系,建立人工智能技术应用的监管和风险防范机制。
对人工智能活动进行立法。建立面向人工智能的现代化治理体系和制度,进一步完善法制法规体系,探索制定有关人工智能和机器人的法律,构建以伦理为基础、以规范为目标、以价值为导向的人工智能治理法制体系,在规范技术应用、研发活动、信息共享等的基础上,鼓励人工智能技术创新,同时注重在道德层面进行引导。在技术研发及推广过程中要对机器智能活动进行分类指导、分级量化,不能根据不同等级制定不同的规则,应规定活动范围,明确机器智能服务背后的民事主体,确定对应的权利、责任和义务,推动人工智能技术和产业良性发展。
完善治理机制。在制定人工智能相关的公共政策过程中,应考虑到社会发展公平正义的要求,制定相关的产业经济政策和社会政策,实现良好的价值导向。确定包括透明要求、开源要求在内的关键治理原则,消除或规避人工智能的算法偏差和机器歧视,完善社会保障机制,缓释技术创新带来的失业潮等社会风险。加强数据治理,规范数据的分享、使用和数据价值的分配。提高人工智能算法模型的透明度,加强开源、平台和共享框架建设,加强相关协作标准的制定和开放平台的搭建,研究促进合作框架的形成,推动形成人工智能全球治理机制。充分发挥主权国家的多边主义作用,引入多种利益方相关模式,探索合作共赢、成果共享的途径,防止巨头垄断的形成,使全球人工智能发展形成合力。
加强监管。推动技术和社会的良性互动,监管是不可缺失的一环。监管部门应根据相关政策的特点,制定相应的监管政策,对人工智能的创新机制、算法模式、应用过程等关键环节和关键内容进行监管,对智能服务产生的结果进行合理判定。持续规范智能机器的行为,维护行业秩序,平衡技术创新与社会风险,保障人类的权益。加强人工智能风险事先预防和监控,拓展良好的风险规避和报告路径。研究推动人工智能服务相关的保险产品创新,要求相关保险机构推出相应的企业责任保险、失业保险等,为被保险者提供保险服务,在一定程度上弥补纠纷、失业带来的损失。
随着人工智能技术商用成熟度的不断提升,智能金融新业态正逐步渗透于传统金融行业的各个领域和各个环节,从银行、证券、保险到市场基础设施,从营销推广、风险控制、客户服务到产品设计,人工智能与金融业务深度融合发展,催生了智能营销、智能风控、智能客服、智能运营、智能投顾、智能投研等一系列智能金融应用。
作为发展相对成熟的人工智能技术,计算机视觉、语音识别侧重于图像、视频、音频等模态的信号识别和内容感知,如应用较为热门的人脸识别、OCR光学字符识别、声纹识别等技术。这些智能识别技术在金融领域的广泛应用,不仅改变了金融服务的用户交互方式,而且提高了金融机构的运营管理效率。
近年来,金融服务逐渐由线下走向线上,再到线上线下相互融合,用户交互方式随之大大改变,普通个人用户感触颇深。现在我们通过手机App动一动手指、扫一扫面部,就可以完成金融业务办理;填写银行卡号、证件信息时,不再需要手动输入,而是通过手机摄像头扫描证照原件后系统自动代填;面对纷繁复杂的App功能,我们也可以说出关键词,通过语音交互实现快速智能导航。计算机视觉中的人脸识别和OCR光学字符识别已成为金融行业手机App的标配,语音识别技术推动的语音助手也开始成为大中型金融机构移动客户端的新风潮。
在上述场景中,人脸识别无疑是最有可能带来金融行业变革的人工智能技术。目前,人脸识别广泛应用于用户登录、远程开户、支付转账、业务办理、保险理赔等各类金融场景的身份认证环节,其中在支付领域的应用引起了市场和监管层的极大关注。2019年,支付宝、微信支付、银联云闪付先后推出新一代“刷脸支付”产品,继条码支付之后,在支付行业形成了新的竞争格局。人脸识别技术在提升支付体验的同时,也因弱化交易意愿验证、存在隐私泄露风险等问题引起了较大的争议。2019年8月,中国人民银行发布的《金融科技(FinTech)发展规划(2019~2021年)》指出,将探索人脸识别线下支付安全应用,利用专用口令、“无感”活体检测等实现交易验证,由持牌金融机构构建以人脸特征为路由标识的转接清算模式,实现支付工具安全与便捷的统一。
在运营管理环节,计算机视觉中的图像分割和目标检测技术可辅助金融机构开展抵押、保险标的物的远程检测,减少人员实际前往查勘的相关成本,提升服务效率。例如,在车险领域,基于图像、视频等信息的远程智能定损产品,只需客户上传车辆受损部位的照片或视频,便可自动得出定损结果,“小剐小蹭”等简单车辆损伤案件的识别准确率已达到甚至超越人工标准,大大缩短了定损理赔的处理时间,实现了“闪赔”的极致客户体验。此外,基于语音识别技术的智能质检和智能外呼,为金融机构节省了大量的人力投入,提升了质检质量水平和线路资源利用率。
作为更接近人脑推理过程的人工智能技术,自然语言处理、知识图谱侧重于语义的分析与理解、因果关系的逻辑推理、知识的抽取和表现等认知智能,在智能问答、文本挖掘、机器翻译、知识检索等任务中的表现日益显著。尽管目前其成熟度仍不足以为金融机构创造较高的价值,但其广阔的应用前景促使这些认知智能技术逐步落地,成为金融服务智能分析决策的基础。
着眼于当下的应用场景,智能客服是自然语言处理技术能够为金融机构带来的“即战力”。针对用户各式各样的咨询提问,金融机构利用自然语言处理技术归纳、总结相似的问题,在知识库中智能检索、精准匹配标准问题与答案,实现客服机器人的自动问答,在简单、高频的业务咨询中有效减少了人工客服的数量,降低了运营成本。但是,目前商用的智能客服更像是在线自助查阅的“服务说明书”,依赖于建立一个高质量、可扩展的语料知识库。其中的标准问题与答案仍需要大量的人工维护和审核,AI扮演的角色只是人工的辅助。而自然语言处理、知识图谱等认知智能技术的融合应用和创新发展有望推动客服机器人自主地从金融机构大量的内部文本资源中提取规则、知识,从而在智能客服的问答对话中展示更好的智能表现。
在投资管理领域,自然语言处理、知识图谱等人工智能技术与大数据分析相结合,带来了智能投研。与智能投顾主要面向C端长尾用户不同,智能投研主要面向B端资产管理机构,向其提供一种辅助性的投资研究工具。它能够自动从招股书、年报、公司公告、券商研报、新闻等文本和表格数据中提取关键信息,构建产业链知识库和企业画像,完善研究方法,输出投资观点。当然,现阶段智能投研自动生成的研究报告的可用性不强,但在数据搜集、信息提取方面大大提升了资产管理机构的工作能力和效率,成为投研人员更好的辅助工具。
从金融行业实际的应用效果看,知识图谱技术逐步应用于风险评估与反欺诈、精准营销、产品个性化设计等领域,在处理非结构化信息、整合多源数据、分析关联关系等任务中显现出较强的智能化优势。例如,在信贷风控场景中,知识图谱基于客户的借款记录、消费记录和行为记录,构建关联关系,从而有效预防多头借贷、黑产攻击等问题。虽然知识图谱技术本身的商用成熟度仍有待提升,整体应用广度和深度还比较有限,但其“金融大脑”的核心地位使其有望成为未来智能金融发展的新动力。
目前,人工智能技术在金融行业的广泛应用主要是基于单一智能技术的产品应用形态,如人脸识别、OCR光学字符识别、客服机器人等。为了在金融行业创造更大的价值,领先的金融机构和人工智能技术服务商正在努力推动面向金融场景的综合解决方案,以满足金融服务各个环节的智能化需求。
以语音交互场景为例,市场上现有的语音助手和客服机器人的功能往往相互脱节,大多数在线客服仅能通过文字交流,缺乏统一的客户体验。为了实现智能化的语音交互服务,某持牌金融机构基于语音识别、自然语言处理、知识图谱等多种人工智能技术,对源自客户语音的文本内容进行语义理解和知识检索,并生成准确的文本应答,最终通过语音合成技术向客户反馈,形成了集智能客服、智能质检、智能外呼等于一体的智能语音交互平台。
在银行业,中国工商银行于2019年11月发布智慧银行生态系统ECOS,从信息科技整体架构层面布局人工智能、区块链等前沿技术,在客户服务、精准营销、风险控制、决策管理等各个环节提供更加智能高效的科技支撑。此外,自2018年以来,领先的银行机构纷纷成立金融科技子公司,在构建自身核心竞争力的同时,也在积极布局向外提供技术输出和场景化的智能金融解决方案。
现阶段,人工智能技术为金融行业创造的价值主要体现在各个环节的降本增效以及客户体验的改善。大量自动化执行的工作流程在简单、高频的重复性任务替代方面发挥了重要作用,更强大的数据处理和分析能力拓展了可利用的数据资源和关联关系,显示出超越人脑的智能。人工智能技术为金融机构降低运营成本、提升服务效率、增强风控能力提供了强大的技术支撑,智能化的交互方式也带来了优质的客户体验。
长期来看,智能金融将更加关注客户多样化、个性化的需求,推动产品设计与定价差异化、客户服务与营销精准化,真正实现以客户为中心,提升金融服务的客户满意度。越来越多的金融机构,尤其是商业银行,通过人工智能技术分析客户的身份、行为、习惯等特征信息,形成精准的客户画像,在线上服务渠道提供不同的个性版本、展现不同的功能排列、推荐不同的产品内容,打造“千人千面”的金融服务。相信在不远的未来,除了交互形式的个性化,更多基于定制规则的金融产品也会不断涌现出来,进一步满足客户个性化的需求。
参考文献
36氪研究院:《人工智能商业化研究报告(2019)》,2019。
艾瑞咨询:《2019年中国人工智能产业研究报告》,2019。
爱分析:《实践与展望:AI如何为金融业创造价值》,2020。
刘斌、赵云德:《金融科技:人工智能与机器学习卷》,机械工业出版社,2019。
清华大学-中国工程院知识智能联合研究中心、中国人工智能学会吴文俊人工智能科学技术奖评选基地:《2019年人工智能发展报告》,2019。
易观:《2019年中国人工智能应用市场专题分析》,2019。
赵智慧:《计算机人工智能技术研究的进展及应用》,《信息与电脑》(理论版)2019年第24期。
中国信息通信研究院、中国人工智能产业发展联盟:《全球人工智能战略与政策观察(2019)》,2019。
Benaich,N.,Hogarth,I.,“State of AI Report”,Jun.28,2019.
Liu,B.,Nie,S.,Zhang,Y.,Ke,D.,Liang,S.,Liu,W.,“Boosting Noise Robustness of Acoustic Model via Deep Adversarial Training”,IEEE,2018.
Snyder,D.,Garcia-Romero,D.,Sell,G.,Povey,D.,Khudanpur,S.,“X-Vectors:Robust DNN Embeddings for Speaker Recognition”,IEEE,2018.