运用数据科学技术进行数据分析等工作的人士被称为“ 数据科学家 ”。数据科学家被形容为“21世纪最迷人的职业”,引起广泛的热议。
我们要想洞察大数据的本质,就必须将科学、工程、商业知识结合起来。然而,一个人难以独自掌握所有这些知识。具体到商业领域,根据业务的不同,所需知识也会不同。所以在多数情况下,各有所长的人们会聚集在一起组成团队,作为一个部门开展分析工作(表1-1)。
数据科学家擅长分析数量庞大的数据,但是如果没有数据,那也是巧妇难为无米之炊。因此,数据科学家也需要包括被称为“ 数据工程师 ”在内的各种人士的支持。
除了要加工、整理分析所用的数据,构建服务器等基础设施,并建立利用云端进行数据分析的平台,为数据科学家提供有利于开展分析工作的环境是数据工程师的主要工作。这种工作所涉及的业务范围很广,需要丰富的信息技术知识(图1-7)。
数据分析师 是一个与数据科学家相似的职业。顾名思义,数据分析师是指从事数据分析工作的人。数据分析师是指使用数据挖掘等方法进行数据分析并提供咨询服务的人。
人们有时也将兼任数据工程师和数据分析师的人才称为数据科学家。目前,在这两个领域,都有占据主导地位的大企业。
表1-1 组织内部数据科学家的人员构成
图1-7 数据工程师必备的知识
要点
由于单个数据科学家难以掌握广泛的知识,因此人们通常采用团队的形式进行数据分析。
数据工程师和数据分析师是比较接近数据科学家的职业。