人工智能(Artificial Intelligence,AI)是人类创造的具有思考、思维、判断、学习、适应、反应能力的人工系统。它试图了解智能的实质,并以一种新的与人类智能相似的方式做出反应的智能机器,来模拟、延伸和扩展人类智能。美国麻省理工学院的温斯顿教授认为:“人工智能是研究如何使计算机做过去只有人才能做的智能工作。”人工智能涉及知识表示、自动推理和搜索方法、机器学习和知识获取、知识处理系统、自然语言理解、计算机视觉、智能机器人、自动程序设计等多方面的研究内容。人工智能技术目前主要集中于如何让计算机软硬件来模拟人类从事某些思维过程和智能行为。早期的人工智能技术开发主要集中在专家系统和机器学习领域,期望机器能够学习和积累人的经验来自动提高自己的分析能力。现代人工智能技术的发展期望用手写、语音、拍照、手势、脑波来操作、感知计算机、手机、可穿戴设备等数字终端,让人机交互和人类交流一样简单自然。从思维观点看,现代人工智能技术要实现的不仅仅是逻辑思维,还要进行形象思维和灵感思维,以真正实现智能。为了实现这一目的,语言识别、语音识别、图像识别、情感识别、机器视觉、机器学习、情感感知、环境感知技术在近年来获得了快速发展。
从技术实现角度来看,人工智能主要沿着3条路线展开:一是模拟人类各种逻辑分析和专业判断的专家系统,这种系统通常是基于规则的人机交互系统;二是模拟各种现实数字世界,建立各种认知模型,自动识别和不断学习的机器学习技术,这种技术期望建立各种模型来识别客观世界;三是模拟人类体力和智力行为,驱动设备像人一样从事各种劳动。
人工智能技术应用广泛的一个领域是专家系统。它是一个含有大量某个领域的专家知识和经验,并用以解决该领域实际问题的智能计算机程序系统。它模拟人类专家的决策过程进行推理和判断,以解决那些需要人类专家处理的复杂问题。一个专家系统通常由人机交互界面、知识库、推理机、解释器、综合数据库、知识获取6个部分构成。其中,人机交互界面是用户输入基本信息,回答系统提出的相关问题,输出推理结果及相关解释的对话界面;知识库中包含了模拟专家推理和判断所需要的各种知识和经验;推理机是针对当前问题的条件或已知信息,反复匹配知识库中的知识,得出结论的过程和机制。智能财务分析系统就是一种典型的专家系统。目前专家系统已经和人工智能的其他技术相结合,逐渐向机器智能、智能机器人方向发展。
让机器轻松听懂人类语言的语音识别技术近年来获得迅速发展,它包括语音输入、声音提取、语义理解(理解交流信息)、声纹识别(提取说话人的语音身份特征,提供声纹鉴别和声纹确认)、语音识别(将语音转化为文本)、语音合成(将后台知识库的内容合成为语音文件)、语音质检(语音转写、话者分离、静音检测、语速检测、说话人辨析)等技术,这些技术将语音转化为文本,将文本转化成声音,让机器和人一样实现能说会道,使人类能够通过声音控制让机器完成大量工作。例如,随着深度学习技术的发展,机器翻译质量获得快速提升。目前人工智能翻译系统可以实现多种动听声音的合成和多国语言的翻译转换,让说不同语言的人们之间可以畅通无阻地交流。
让机器具有经验积累和学习能力,以不断提高自己性能的机器学习技术,近年来获得了迅速发展。Alpaydin(2014)认为“机器学习是用数据或以往的经验,优化计算机程序的性能”。它是一门研究机器识别现有知识、获取新知识和新技能的学问。深度学习是模拟人脑进行分析学习的多层神经网络系统,它模仿人脑机制来解释和处理数据,通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习本质上是机器学习技术的一种,主要包括5方面内容,即问题理解与分析、训练环境构建、数据管理、模型训练及生产应用。其核心是如何将实际业务问题转换为深度学习可以解决的技术问题。目前比较知名的深度学习技术方法包括伯克利视觉和学习中心开发的Caffe、微软推出的开源深度学习框架CNTK、LISA开发的基于Python的Theano、Google主推的TensorFlow,以及Torch、MxNet等,这些技术在图像识别、情感识别、环境识别等感知领域均得到实际应用。
图像识别技术(机器视觉)发展的目的是让机器能够看懂人和物,它包括文字图像识别、数字图像识别和物体识别三大类。文字图像识别技术已经应用于名片识别、票据识别、证照识别等领域。数字图像识别是基于数学形态学的图像分割、基于小波变换的分割、基于遗传算法的分割等新方法。物体识别主要指对三维世界的客体及环境的感知和认识,它以数字图像处理与识别技术为基础。随着高清广角摄像头、高清互动触摸彩色液晶屏、各种传感器、红外线射频识别技术、扫码技术、问题交换知识库、自动应答和伺服系统、GSP全球卫星定位系统、智能搜索和专家系统的发展,图像识别和感知技术获得了快速发展,已经能够得到对特定环境变化感知的程度。但是,让机器能够看得见、看得懂,能够和人一样观察外部世界,还需要付出艰苦的努力。
情感识别是让计算机观察人的表情、行为、环境来推理情感状态,主要包括情感特征识别、面部表情识别、人体姿态情感识别、语音情感识别、生理信号情感识别等内容。情感计算是通过提取人的生理特征信号(皮电、肌电、心电、皮温、脉搏、脑电、呼吸信号等)识别情感状态。近年来,随着面部生物特征识别人脸表情的人脸表情识别技术的发展,以及根据声带、口腔、鼻腔结构等声音特质识别人类语气和说话情绪的语音情绪识别技术发展迅速,机器理解人类语言、面部表情、手势和情感意图的能力有了一定进展。
机器人(Robot)是自动执行工作的机器装置。它既可以接受人类指挥,又可以运行预先编排的程序,还可以根据以人工智能技术制定的原则纲领行动。机器人已经广泛应用于汽车、电子、纺织、食品、化妆品、医药等制造业,建筑业以及其他具有重复性劳动、具有危害健康或危险性质工作的领域。一般机器人具有传感信息(包括视觉、听觉、触觉、接近觉、力觉和红外、超声及激光等)处理、控制与操作的能力,其通常受控于外部计算机,动作由外部计算机的智能处理单元发出控制指令指挥。智能机器人具有感知、处理、决策、执行等模块,可以像人一样独立地活动和处理问题。
从用途来看,机器人可以分为工业机器人、农业机器人、服务机器人等。工业机器人目前有焊接机器人、装配机器人、喷漆机器人、码垛机器人、搬运机器人等。农业机器人以动植物等复杂作业对象为目标,主要从事耕种、施肥、喷药、蔬菜嫁接、株苗移栽、采摘、收割、灌溉、养殖和各种辅助操作等农业领域的作业。空间作业机器人在大气层内和大气层外从事各种作业,包括在内层空间飞行并进行观测、到外层空间进行探测等。服务机器人是一种以自主或半自主方式运行,能为人类生活、康复提供服务的机器人,或者是能对设备运行进行维护,如步行机器人、写字机器人、奏乐机器人、玩具机器人、助老助残机器人、教育娱乐机器人、医疗机器人、水下作业机器人、扫地机器人等,目前在医疗、护理、执勤、救援、娱乐、清洁、设备维护保养等领域获得广泛应用。
财务机器人(Robotic Process Automation,RPA)是基于计算机编码和规则的流程自动化软件,它可代替人工来执行高度可重复的工作。财务机器人通过执行重复的基于规则的计算机处理程序来完成一项任务。这项任务的流程必须明确,并可转化为指令和输入(不得有没有提前定义的例外情况),以外挂的形式在用户的现有系统上实现鼠标单击、键盘输入、复制、粘贴等一系列日常计算机基本操作。财务机器人目前仅仅是一种以固定操作流程完成日常业务工作的自动化系统,还没有达到智能化的程度。
智能财务机器人要能够使用人工智能技术自动识别发票等原始单据,通过内置财务机器人(如审核机器人、收付机器人、记账机器人、对账机器人、结账机器人、报表机器人等)实现财务的自动审核与记账。通过智能财务机器人的自主学习和完善,实现自我认知,完成智能报表的出具。智能财务机器人要能够优化财务流程、提高效率,并从感知能力、计算能力、认知能力等方面提高精度,实现智能财务应用。智能财务分析系统驱动的财务分析机器人,基本上具备了这种对数据的分析能力。