购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1-3 综合各种知识进行分析

数据科学、数据挖掘

数据科学所需要的知识是什么呢

我们分析数据时,并不是单纯知道分析方法就可以了。那是因为即使我们了解数学分析的手法,如果没有关于编程的知识,也无法用程序处理实际的数据。

另外,我们即使熟悉编程,但是如果没有商业方面的数据知识,那就不了解数据的商业意义,自然也就无法处理数据。

像这样,综合数学与统计等科学领域的知识、编程与服务器构建等工程领域的知识、经济与经营等商业领域的知识等进行数据分析的科学,被称为“ 数据科学 ”(图1-5)。

从数据中获得未知的知识与见解

在分析数据时,我们想要获得的是“新的知识与见解”。如果能从数据中发现人们无论如何思考都想不到的东西,那就太理想了。人们把从数据中获得新发现比喻为从地下开采矿物(挖矿),称之为“ 数据挖掘 ”(图1-6)。

“买纸尿裤的人经常会同时购买啤酒”的发现令数据挖掘这一名词变得广为人知。据说人们发现来商店购买纸尿裤的父亲会同时购买啤酒。对于事情的真假,我们暂且不论,总之,这已成为人们谈论的一个有趣的话题。

像这样,数据挖掘就是指综合人工智能等技术对大量的数据进行分析,推导出数据的趋势,找到最优组合的工作。因为这种工作需要做高端分析,所以一般在大学等研究机构以及企业研究开发部门等进行,对于在这里获得的知识与见解,我们人类必须充分地加以利用。

图1-5 数据科学的相关领域

图1-6 数据挖掘的事例

要点

数据科学需要广泛的数学、统计、编程及商业知识。

人们将通过对大量数据的分析获得人类未知的知识与见解称为“数据挖掘”。 hYNIq0ZoANjMtwy7fsXQ/6/EOfmCyt9FStJiJKghsLMtHK3KLoTBDOKFpF/hem5B

点击中间区域
呼出菜单
上一章
目录
下一章
×