近年来,随着人工智能技术的不断发展,人工智能正影响着科技进步、产业变革、经济发展,交通、教育、医疗、安防等领域都有人工智能技术的影子,自动驾驶、人脸识别、语音识别等人工智能技术都在深深地影响着人们的日常生活。2017年5月,谷歌公司开发的AlphaGo在中国乌镇围棋峰会上与排名世界第一的世界围棋冠军柯洁进行了三场人机对弈,并以3∶0的成绩取得了人机大战的压倒性胜利。这一事件标志着人类社会已经正式进入了人工智能时代。
人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它是计算机科学的一个分支,企图通过了解智能的实质,生产一种新的能以与人类智能相似的方式做出反应的智能机器。人工智能的研究领域包括图像识别、自然语言处理、语音识别、机器人等方面。
图像识别是人工智能的一个重要领域,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。图像识别技术在公共安全、生物、工业、农业、交通、医疗等很多领域都有应用,如交通领域的车牌识别系统、安防领域的人脸识别和指纹识别技术、食品领域的食品质量检测技术、医学领域的基于 CT 图像的疾病检测技术等。随着人工智能技术的不断发展,图像识别的算法也在不断地改进。鉴于图像是人类获取和交换信息的主要来源,图像识别将是未来人工智能领域的研究重点。
自然语言处理是一门融语言学、计算机科学、数学于一体的科学,它主要研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法,其主要目标是弥补自然语言与机器语言之间的差距,实现人与计算机的无限制交流,最终使计算机在理解自然语言上像人类一样智能。自然语言处理是人工智能的又一个重要方向,它的主要应用包括信息提取、机器翻译、垃圾邮件、文本情感分析、自动问答等。自然语言处理的发展将使人工智能可以逐渐面对更加复杂的情况,解决更多的问题,必将带来一个更加智能化的时代。
语音识别技术的目标是将人类语音中的词汇转换为计算机可读的输入,如按键、二进制编码或者字符序列。语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术,如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,如语音翻译、信号处理和模式识别等。
机器人则是可代替或协助人类完成各种工作的智能体,大多枯燥、危险、有毒或有害的工作,都可由机器人代替人类完成。机器人除了广泛应用于制造业领域,还应用于资源勘探开发、救灾排险、医疗服务、家庭娱乐、军事和航天等其他领域。机器人是我国未来产业的重点发展方向。《“十四五”机器人产业发展规划》提出,“到2025年,我国成为全球机器人技术创新策源地、高端制造集聚地和集成应用新高地”,“到2035年,我国机器人产业综合实力达到国际领先水平,机器人成为经济发展、人民生活、社会治理的重要组成”。
人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,人工智能的核心是机器学习。在维基百科中,机器学习有以下几种定义。
■ 机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
■ 机器学习是对能通过经验自动改进的计算机算法的研究。
■ 机器学习指用数据或以往的经验来优化计算机程序的性能。
机器学习一般可以分为监督学习、无监督学习、强化学习三类,其常见算法包括决策树、朴素贝叶斯、支持向量机、随机森林、神经网络和 Boosting。机器学习是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。
深度学习是机器学习领域一个新的研究方向,是一种实现机器学习的技术。深度学习的概念源于人工神经网络的研究,是利用深度神经网络来解决特征表达的一种学习过程。深度学习的概念与浅层学习相对。传统的机器学习方法一般采用浅层结构的算法,存在一定的局限性,如表示复杂函数的能力有限,对复杂问题求解时的泛化能力受到一定的制约。而深度学习可通过学习一种深层非线性网络结构来实现复杂函数逼近,表征输入数据的分布式表示,学习数据集的本质特征。
深度神经网络本身并非一个全新的概念,可理解为包含多个隐藏层的神经网络结构。由于深度学习模型中包含更多的隐藏层,模型中神经元连接权重、阈值等参数也更多,深度学习模型可以通过组合底层特征形成更加抽象的高层来表示数据的属性类别和特征,更好地实现数据的分布式特征表示,从而获得更好的模型训练效果。
综上所述,人工智能的核心是机器学习,而深度学习则是机器学习中一个新的研究方向,三者之间的关系如图1-1所示。深度学习与传统机器学习相比,采用了更为复杂的深度神经网络,是机器学习领域的一个分支。
图1-1 人工智能、机器学习与深度学习之间的关系