人工智能是计算机科学的一个分支,主要研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统等。阿兰·图灵(Alan Turing)提出的图灵测试可作为某个系统是否具有智能的判断依据:一个人在不接触对方的情况下,通过一种特殊的方式和对方进行一系列的问答。如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,且对方确实是计算机,那么就可以认为这个计算机是智能的。近年来,以机器学习为代表的人工智能技术得到了广泛的应用,人工智能技术已经充斥于人们的日常生活,例如人脸识别、自动驾驶、智能问答和智能安防等。尤其是近十年,得益于数据的增多、计算能力的增强、学习算法的成熟以及应用场景的丰富,深度学习在各项应用上展现出了巨大的优势。
人工智能虽然可在某些方面超越人类,但想让机器真正通过图灵测试,具备真正意义上的人类智能,这个目标还很遥远。
典型的人工智能系统是专家系统,它把知识以形式化的语言进行硬编码,电脑可采用逻辑推理规则来自动理解这些形式化的语言。例如,早期的计算机可打败人类最好的象棋选手,这是因为抽象和形式化的任务对于人类而言是非常困难的脑力任务之一,对于计算机而言却是非常容易的。但是人们的日常生活中具有大量的知识,很多知识难以进行形式化的表达,这导致高级智能难以实现。其实,人工智能也可以自动学习知识,这种方法比人工设计的规则更能适应复杂的环境。例如,直到2012年前后计算机才在识别物体或语音任务中达到人类平均水平,2016年3月DeepMind团队研发的阿尔法狗(AlphaGo)才在围棋游戏中以4:1战胜了韩国名将李世石。
人工智能应该具备自己获取知识的能力,而不是人工设置各种规则,这种能力被称为机器学习(Machine Learning)。机器学习也叫作模式识别,它是指从有限的观测数据中学习出具有一般性的规律,并将总结出来的规律推广应用到未观测样本上。机器学习需要提取一个合适的特征集,但对于计算机视觉和自然语言处理领域而言,很难确定哪些特征是最优的。
表示学习(Representation Learning)通过建立数据和标签的直接映射来提取最优的特征集,这可避免手工设计特征的麻烦,其典型代表是自编码器。深度学习通过较简单的表示来表达复杂的问题,解决了表示学习中的核心问题(从原始数据中提取高层次、抽象的特征),让计算机可通过较简单的概念构建复杂概念。卷积神经网络是深度学习最具有代表性的算法。