购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

◎ ◎ ◎ ◎ ◎ ◎ ◎ ◎ ◎ ◎

第1章
引言

机器学习在商界已经成为越来越重要的分析工具,事实上从业者在方方面面的工作中都已经感受到了其影响。机器学习的核心在于运用大数据来研究各个变量之间的关联性,在千丝万缕的交互变量中寻找规律,并进行分析和预测。迄今为止,机器学习运用于分析和预测消费行为、股票市场价格等,已经屡见不鲜。随着计算机速度的提高以及大数据存储成本的降低,我们运用机器学习的广度会有所拓宽,深度也会有所加深,而这些应用在20年前或30年前根本都是无法想象的。

机器学习是人工智能的一个分支。人工智能的核心在于开发机器对于人类智力的探索和模仿,而机器学习通过对大量数据的处理有效提高了人工智能的效率。毋庸置疑,机器学习是人工智能发展史上最值得期待,并且也是最具商业价值的环节。

为了解释机器学习与其他人工智能方法的区别,我们举一个简单的例子,假设我们想编一套计算机程序来模拟“井字棋”程序(tic tac toe,又名noughts and crosses)。一种方法是向计算机提供一个查找表,列出可能出现的位置,以及对应每个位置上的人类专业玩家所能做的移动;另一种方法是向计算机呈现大量的游戏(例如,通过安排计算机与自身进行数千次的对抗),并让计算机学会最好的动作,该方法就是机器学习的应用。以上两种方法虽然都可以成功用于类似井字棋这样的简单游戏,但机器学习方法可以用于更复杂的游戏,如国际象棋和围棋,而第一种方法显然是不可能的。

语言翻译可以很好地说明机器学习的能力。我们如何对计算机进行编程来实现两种语言之间的翻译呢,比如从英语到法语?一种做法是给计算机输入一本英法词典。不幸的是,逐字翻译的效果会很差。因此我们很有必要尝试其他编程规则,即对英语语法和法语语法也进行编程。但这并不容易实现,即使做到了,结果也远非完美。谷歌开创了使用机器学习的一套更好的方法,这就是在2016年11月宣布的、被称为“谷歌自然语言翻译”(GNMT)的算法。 计算机首先被提供了数百万页的材料,由专业翻译人员从英语翻译成法语,然后让计算机从这些材料中学习,并建立自己的翻译规则。与以前的方法相比,通过这种方法得出的翻译结果确实有了很大改进。

数据科学包含机器学习,但数据科学有时被认为是一个更为广泛的领域,比如系统开发和运用,这些运用是为了帮助决策者进行业务决策。 在本书中,“机器学习”和“数据科学”这两个术语是等同的。这是因为,如果机器学习专家不参与助推其雇主想要实现的管理目标,就很难看出这些专家在商业领域中是如何有效地工作的。

机器学习或数据科学是统计学中的一个全新领域。传统统计学讨论的基本内容包括概率分布、置信区间、显著性检验、线性回归等。掌握这些基础理论知识非常重要,但现在我们可以通过大数据来研究一些过去无法实现的功能,例如:

·通过非线性模型来预测和提高决策的正确性;

·可以在数据中搜索,以提高公司对其客户和经营环境的了解;

·开发一套决策规则来应对当下复杂多变的环境。

如上所述,机器学习所能实现的很多功能都离不开计算机运行速度的提高和数据存储成本的降低。

当统计学家或计量经济学家涉猎机器学习时,他们对一些术语可能会感到很奇怪。例如,统计学家和计量经济学家喜欢谈论自变量和因变量,而决策者喜欢谈论特征和目标。随着本书的展开,我们将解释这些数据科学术语,并在本书最后提供术语表。 zot1aZcmOD48nYW8K8hPoJ3swgyatg9NZ0K4V0ztGQH019MIIfyntnO0BGVKC9Gu

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开