提到机器学习,首先要讨论的是,到底什么是机器学习?美国计算机人工智能领域和游戏领域的先驱者Arthur Samuel认为,即使不明确编码,机器学习也能使计算机拥有学习的能力。
机器学习领域的先驱者卡内基梅隆大学的教授Tom M. Mitchell提出一个被更广泛地接受的正式定义:针对某种类型的任务T,可以认为一个计算机程序从经验E中学到了知识,效果为P,并且这个效果P能够随着经验E的增多而提高。
简单来说,机器学习是一种利用统计学和其他数学理论给予计算机学习能力的方法。机器学习和统计学其实有相同的目标——从数据中学习知识,但是具体的手段和理念有所不同。机器学习是计算机科学的一个分支,侧重的是从数据中建立有机的系统,而不是用目的很明显的规则去编程。而统计学是数学的一个分支,侧重的是用数学公式建立变量之间的联系。近年来,随着计算机硬件成本的不断降低和数据量的急速增加,数据科学家得以充分利用机器学习手段来分析和挖掘数据。而统计建模技术则早在计算机问世前就已经存在。