当前,人工智能技术和产业正处于快速发展阶段,未来发展前景广阔,具有政策和商业资本支持力度广、技术水平提升速度快、市场需求量大的特点。从学术进展角度看,生成模型、机器学习、机器视觉等领域是人工智能目前发展的重点方向。
NeurIPS作为全球人工智能久负盛名的盛会之一,其接收的论文带代表着当今神经科学和人工智能研究的最高水平。与传统上专注于机器学习、计算机视觉和自然语言处理等主题不同,2022年NeurIPS大会新增“创意人工智能赛道”,重点是如何利用人工智能来创造视觉艺术、音乐、文学、表演艺术等新形式。这是对生成模型快速发展和其在创造性追求中日益增长的需求的认可。人工智能将成为强大的创作工具,使艺术家和创意人员可以探索新的艺术范式。
根据NeurIPS官方数据,2022年共收到投稿447份,其中163份被录用,录取率36.46%。在被录用的163篇论文中,超过50%的论文被确定为引入了新的数据集,而另一半则提出了新的基准。计算机视觉方向占23%,自然语言处理方向占8%,强化学习和模拟环境方向占比7%,多模态数据方向占比6%,其余方向还包括语音处理、可解释的AI和伦理等。其中,杰出论文奖项(Outstanding Papers)共12篇,包括分布外检测、生成模型、语言模型、超越神经缩放定律等多个方向,如下表所示。
表1.1 2022年杰出论文奖项统计
国际先进人工智能协会(Association for the Advancement of Artificial Intelligence,以下简称AAAI)是人工智能领域的主要国际学术组织之一。根据其发布的2022年论文主题数据来看,机器学习、深度学习、计算机视觉、NLP是重点关注领域。其中,深度学习相关的论文共计72篇,包括经典的深度神经网络、DeepFake相关、深度表达等方向;图结构数据相关的论文共计125篇,而经典的表示学习、监督学习、Transformer以及多智能体等仍然是主流范式。此外,隐私保护相关的论文共计24篇,较上一年度增长了140%;可解释性相关的论文29篇;在机器学习的具体应用中,目标检测(Object detection)、文本分类(Text Classification)等仍然是关注度较高的方向。
人工智能已经和传统产业深度融合,将带动人工智能技术的体系化、集成化和专用化,并推动产业的数字化和智能化。到目前为止,人工智能已经发展为包括大数据和云计算、物联网、智能机器人、智能推荐、5G、区块链、语音识别、虚拟/增强现实、智能芯片、计算机视觉、自然语言处理、生物识别、空间技术、光电技术、自动驾驶、人机交互和知识图谱17种技术在内的复杂技术体系。
(1)机器学习算法
目前,国际上机器学习的研究重点主要集中在深度学习、强化学习、自然语言处理等领域。随着云计算、大数据和计算机硬件技术不断发展,机器学习开始在各行各业取得显著成效,成功的商业应用不断入市。其中,最具有代表性的应用来自苹果的Siri、微软的Cortana等语音助手,各大支付应用推出的人脸识别认证技术,以及谷歌AlphaGo战胜顶尖人类围棋高手的事实,标志着机器学习已经成为计算机科学中的重要领域。
我国的机器学习技术发展迅速。机器学习与互联网、金融、IT服务行业融合度较高。高校方面,北京大学、清华大学等高水平研究机构设立了机器学习实验室。企业方面,阿里巴巴、腾讯、百度等国内科技巨头在机器学习领域也加力度,通过资金和人才投入推动机器学习技术发展和应用创新。
(2)自然语言识别与处理
目前,自然语言基本形成了一套相对完备的技术体系,包括词嵌入、句子嵌入、编码-解码、注意力模型等,促进了自然语言处理在搜索、阅读理解、机器翻译、文本分类、问答、对话、聊天、信息抽取等重要领域应用,标志着自然语言处理进入大规模工业化实施时代。另一方面,随着软硬件能力的提升,以及在模型、算法的突破,自然语言处理也开始和深度学习结合应用。例如ChatGPT就是基于自然语言处理技术的对话生成模型,通过学习海量的语言数据来模拟人类对话,从而实现内容生成和回答问题的能力。
我国在自然语言识别与处理方面取得了长足的进步。一方面,面向自然语言处理的深度学习技术已支持自动学习语义的分布式表示,并在实际应用中得到充分验证,为进一步融入知识指导信息的方法研究奠定了坚实基础。另一方面,知识表示与推理技术已经初步具备完整的体系,充分利用结构化的知识赋予人工智能不同的能力,为提升模型的可扩展性和鲁棒性提供了支撑。
(3)人工智能芯片
随着人工智能对于计算能力的要求不断提升,突破GPU性能功耗和减少工作限制成为主要研究方向。业界不断提升人工智能芯片的研发投入,以通过更好的硬件和芯片架构,在计算效率、能耗比等性能上得到进一步提升。
目前,人工智能芯片主要包括基于传统架构的GPU、FPGA及ASIC等。短期来看,基于传统架构GPU仍占据市场主导地位;长期来看,FPGA为代表的定制化硬件将成为市场增长点。FPGA具有算力强、可编程、灵活度高的特点,能够更好的满足不同算法、结构、终端和消费者的需求,但面临的技术难度挑战也较大。总的来看,国外的Xilinx、Altera、Lattice和Microchip四家公司占据了FPGA大部分市场,其中Xilinx和Altera两大公司占据了近90%的市场份额。
国内方面,我国的人工智能芯片领域发展保持着强劲的动力。根据Tractica的预测,预计到2025年,中国人工智能芯片行业未来市场规模将达到726亿美元,年复合增长率将达到46.14%。随着大数据和计算能力的提升,中国人工智能行业市场成长空间巨大,2030年市场规模有望突破千亿元。
(4)深度学习框架平台
目前,国外的企业和研究机构纷纷布局深度学习框架平台,伯克利大学和蒙特利尔大学联合推出Theano和Caffe框架、谷歌开发的TensorFlow、Facebook开发的PyTorch占有主要市场地位。伴随着与实体产业的不断融合应用,深度学习在自动驾驶、个性化推荐、自然语言理解和医疗保健等领域发挥了重要的成效。但不同于编程语言JAVA/C++相对于互联网应用那样的成熟,深度学习的产业应用还有很多有待提升和优化的方面。例如基于编译器的算子优化、统一的API标准和数据搬运等。
国内方面,国产深度学习框架平台变得越来越丰富。百度自研深度学习框架PaddlePaddle,旷视推出了AI生产力平台Brain++,并开源了深度学习框架天元MegEngine,华为推出了AI计算框架MindSpore等深度学习框架平台和产品。随着国内应用场景的不断开放,各行业领域对深度学习的需求持续增强,中国人工智能企业持续加大研发投入力度,与国际上深度学习框架相关核心企业和科研机构形成了齐头并进的发展格局。
(1)生物特征识别
生物特征识别技术包括语言、脸、指纹、个人习惯等行为相应进行识别的技术。通过摄像头捕捉,特征提取,再对特征进行分类,完成匹配。随着现代金融业务的在线化发展,越来越多的业务场景需要对客户进行远程的身份核实和认证,生物识别技术也因此在金融领域广泛应用。特别是在移动端,因为其便捷的人机交互体验和保密安全的特点,生物特征识别技术已经成为移动智能终端的标准配置。目前,在金融领域的生物识别技术多用于客户身份验证、远程开户、刷脸支付等场合。
(2)计算机视觉技术
计算机视觉技术是指运用设备捕捉观测对象产生的图像或者是视频中产生的信息。通过以计算机能够理解的方式进行分析和处理,从而使计算机能够识别目标的过程。计算机视觉包含图像分析、视频分析,以及衍生的人体姿态识别、目标跟踪、SLAM(同步定位和地图构建)、OCR(光学字符识别)等子技术。目前,当前的计算机视觉技术达到商业化的水平。在金融领域的标准化使用场景中,人脸识别、票据识别、场景识别等技术的应用代替了原有的人工重复作业,升级成为更高效、便捷的客户交互方式。
(3)知识图谱
知识图谱是用来描述信息资源和资源载体之间的关系的技术,一般包括挖掘、分析、构建和显示等。在金融应用场景中,通过知识图谱技术构建的产业链图谱是赋能金融机构智能投研的重要工具。产业链图谱可以有效提高金融机构获取行业信息和企业信息的便利性,提升研究分析的效率。在金融业务中,通过对行业进行细分,对贷款信息、行业信息建立关系挖掘模型,并通过机器学习进行模型的训练,展示每个行业及与其关联度最高的相关行业,若某一行业发生了行业风险事件,可以及时预测未来有潜在风险的关联行业。
(4)智能语音
智能语音技术实现了人机语言通信,创造了更智能的客户互动模式,包括语音识别技术(ASR)和语音合成科技(TTS)。智能语音技术目前已经成为中大型金融机构的标配之一,在问答、咨询、理财、查询、身份识别、智能客服、智能理赔等多个场景中进入到生产环境。整体来看,智能语音技术最具价值的应用在于与客户交互、服务相关的环节中,起到降本增效的目的,满足银行等金融机构在业务方面的语音服务需求。
目前,通过人工智能技术,各行各业的企业可以实现自动化流程、增强能力,并做出更明智的决策。据麦肯锡全球AI状况年度调查显示,组织中采用人工智能的比例从2017年的20%翻倍至2022年的50%。同时,2022年的调查还表明,采用人工智能可能带来显著的财务效益:25%的受访者将其公司5%或更多的净利润归功于人工智能。
全球人工智能产业规模快速增长。随着数据量的增长及相关复杂性不断增加,传统软件无法处理、分析及提取其中有用的信息,产生对人工智能技术需求。根据沙利文的报告,2025年全球人工智能软件市场规模预计将达到1218亿美元,占总支出比例的55.1%,2020-2025年复合增速达到31.9%。
欧盟发布《2030数字化指南:欧洲数字十年》《升级2020新工业战略》等文件,计划全面重塑数字时代全球影响力,其中将推动人工智能发展列为重要方向。同时,欧盟不断加大人工智能产业资金支持力度,大力促进欧洲的数字变革。欧盟有史以来最大研发和创新项目“地平线欧洲”总投资额达955亿欧元,明确将人工智能列入资金支持范围。2021年4月,欧盟以条例的形式通过“数字欧洲计划”,对包括人工智能在内的项目进行投资,总额达75.9亿欧元。
美国陆续成立了国家人工智能倡议办公室、国家AI研究资源工作组等机构,各部门密集出台了系列政策,将人工智能提到“未来产业”和“未来技术”领域的高度,不断巩固和提升美国在人工智能领域的全球竞争力。美国2021年人工智能非国防预算增加约30%,总额达到15亿美元。此外,在《美国创新与竞争法案》中,将人工智能、量子计算等列为2022财年美国研发预算优先事项,将对包括人工智能在内的多个领域共投入1000亿美金进行研发工作。2021年7月,美国国家科学基金会联合多个部门和知名企业等,成立11个国家人工智能研究机构,涵盖了人机交互、人工智能优化、动态系统、增强学习等方向,研究项目更是涵盖了建筑、医疗、生物、地质、电气、教育、能源等多个领域。
日本继制定《科学技术创新综合战略2020》之后,于2021年6月发布“AI战略2021”,致力于推动人工智能领域的创新创造计划,全面建设数字化政府。日本将基础设施建设和人工智能应用作为重点,提出加快建设相关基础设施,重点强调了跨行业的数据传输平台以及人工智能相关标准等,全面推动人工智能在医疗、农业、交通物流、智慧城市、制造业等各个行业开展应用,并加大对中小企业的支援。
英国于2021年9月发布国家级人工智能新十年战略,这是继2016年后推出的又一重要战略,旨在重塑人工智能领域的影响力。英国将投资和规划人工智能生态系统作为长期战略,启动国家人工智能研究与创新计划,支持人工智能先进研究等,确保人工智能惠及所有行业和地区,促进人工智能的广泛应用。据统计,2014年到2021年之间英国对人工智能的投资已经超过23亿英镑。
以2015年《中国制造2025》出台为开端,人工智能被写入“十三五”规划纲要及政府工作报告。2017年国务院发布《新一代人工智能发展规划》,将人工智能上升到了国家战略层面。随后多部门相继出台若干核心政策和规划,为我国人工智能行业快速发展提供助力。《中共中央关于制定国民经济和社会发展第十四个五年规划和2035远景目标纲要的建议》指出,要瞄准人工智能等前沿领域,实施一批具有前瞻性,战略性重大科技项目,推动数字经济健康发展。面向人工智能领域创新需求的投资不断加大。我国十四五规划纲要明确大力发展人工智能产业,打造人工智能产业集群以及深入赋能传统行业成为重点。
据工业和信息化部统计数据显示,截至2022年6月,我国人工智能企业数量超过3000家,仅次于美国,排名第二,人工智能核心产业规模超过4000亿元。我国人工智能企业在智能芯片、基础架构、操作系统、工具链、基础网络、智能终端、深度学习平台、大模型和产业应用领域的创新创业活动,为自主可控技术体系的构建和产业国际竞争力的提升奠定了基础。平台企业、独角兽公司、中小企业、新创企业、研究型大学、科研院所和投资者之间相互协作,共同构建富有活力的产业创新生态,人工智能产业发展表现出日益明显的集群化趋势。
在大力推动人工智能发展的同时,我们也应该认识到人工智能带来的诸多问题和挑战。首先,在国际技术摩擦逐步加大的背景下,国外企业在芯片、硬件、算法和平台等方面占据了领先优势,严重压缩了我国人工智能创新发展的空间,全球技术发展不均衡带来了新的“科技霸凌”问题。其次,随着基于大语言模型的应用快速创新,其输出的价值观可能与人类主流价值观存在矛盾,“AI对齐”等问题为全球科技治理和伦理带来了新的挑战。再次,人工智能可能带来“机器冰冷”等挑战,高度智能化会对传统产业进行快速的降维打击,可能加剧不平等、劳动力过剩、情感疏远和人性缺失等社会问题。最后,大语言模型的“可解释性”一直是各方关注的重点问题,黑盒的算法在逐步“进化”的过程中,可能输出意想不到的结果,尤其用在军事、金融等特殊领域,可能造成极大的损失。
因此,在推进人工智能产业创新发展的同时,需要避免或降低人工智能带来负面影响。一是制定明确的发展原则、策略和技术路线,从制度、技术、金融和法律等方面建立完善的保障体系,降低技术发展的试错成本。二是加强大模型关键技术研究,突破计算能力、算法可解释性、数据质量等瓶颈问题,避免“卡脖子”问题对我国人工智能产业发展带来的影响。三是推动建立人工智能商业生态,以技术平台为基础构建开发者社区、公共服务平台等载体,在各领域培育“杀手级”应用,形成闭环的商业生态。四是强化人工智能伦理治理,将治理规则融入到人工智能技术生命周期过程中,提升人工智能的公平性、透明性和人性化等能力。