购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.1 初识数据分析

如今,互联网科技企业越来越多,人们在生产和生活中也在不断产生新的数据。为了处理这些新产生的数据,数据分析就显得格外重要,于是,很多企业设置了“数据分析师”这一新岗位。数据分析师的主要职责就是对互联网中累积的数据进行清洗处理,并以可视化技术等手段进行分析,为企业构建用户画像以生产对应商品。本节将对数据分析的基本概念做详细介绍。

1.1.1 为什么会有数据分析

用户使用互联网浏览信息会产生大量的数据,这些数据可能来自不同的领域,而数据分析的目的就是把隐藏在一大批看起来杂乱无章的数据中最有价值的部分提炼出来,从而找出需要研究的对象的规律,得出有价值的信息。例如,用户在日常生活中会用到某些购物平台,这些购物平台往往会设计一种模块——猜你喜欢,平台利用这一模块向用户推送其可能感兴趣的商品(购物平台通过分析用户搜索某类商品的频次来判断其是否对这类商品有意愿购买),从而间接提高商品的浏览量和购买率。

1.1.2 怎样去做数据分析

数据分析师的基本职业素养便是对数据敏感。数据分析师应该可以利用计算机对数据进行最基本的数据预处理,还应该具备基础的统计学知识。一名优秀的数据分析师会有自己独到的见解,会结合当今社会的时代发展背景去分析数据,如果脱离了现实认知,那么分析的结果就没有太大的价值。同时,数据分析中的数据源是所研究问题的周边化的数据,需要数据分析师利用自身具备的数学知识进行数据的概率化操作,因此,数学知识也是一名数据分析师应该具备的基础知识。除此之外,数据分析师还应具备对应行业的专业知识。

数据分析的基本流程包括确定分析目标及思路、数据获取、数据预处理、数据分析与建模、数据可视化及结果验证、数据应用,如图1.1所示。

图1.1 数据分析的基本流程

分析目标及思路,也可以叫作需求分析,这是数据分析的第一步,也是最重要的一步,是一个分析问题、拆分问题的过程。通过分析要研究的目标得出分析思路,确定需要对哪些方面进行具体的分析,有助于明确整个数据分析过程中的每一步。

数据获取是数据分析师在数据分析过程中与数据的第一次“见面”。在确立了分析需求之后需要用一些技术手段获取数据,包括但不限于下载数据集、爬取数据。通常数据分析师需要具备利用网络爬虫爬取数据的能力,可以利用爬虫技术进行数据的实时抓取,确保数据的有效性。而对于实时性要求不高的数据,则可以从企业数据库或者相关网站导入不同类型的数据集来进行数据分析与可视化。

数据预处理是数据分析过程中的关键步骤,数据预处理的成功与否直接影响数据分析与建模的准确性和一致性。数据预处理大致分为4个基本步骤,分别是数据合并、数据变换、数据清洗和数据标准化。数据合并是对数据进行简单的归类,为数据分析创建好数据分类集;数据变换可以将数据加工成建模时需要的形式,为数据建模做准备;数据清洗可以将数据中的缺失值、异常值和重复值等处理掉,最大程度地提高数据分析结果的准确度;数据标准化是对数据进行规范化操作,使数据分析更加高效。

数据分析与建模是数据分析的核心。通过建模可以得出数据中存在的特定规律,而模型就是这种规律的抽象化实例。数据分析就是通过一系列规范化的方法将数据中的有用信息提取出来,最终进行相应的数据处理。

如今的企业越来越习惯于数据分析带来的直观且高效的收益,此时可视化就是呈现数据分析结果的重要步骤。将数据分析结果以图表的形式展现出来,会更加清晰、直观。但是,这些图表只是目标数据主观分析结果的体现,因此,验证这一结果就显得尤为重要。

数据应用则是将数据分析结果运用到相应的领域中,帮助企业设计出合适的方案或生产出符合需求的产品。 jFxYWyLTl0HvICD4/zphWNGq3ct4+tLMJnZKepxybZSSvV2Zw1wkRJiqZu4K4JMy

点击中间区域
呼出菜单
上一章
目录
下一章
×