购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第2章
面向SAP专业人员的数据科学

如果你是数据科学家,可能不需要本章中的很多信息。我们试图让SAP专业人员快速了解数据科学家已经知道的知识。

作为SAP业务分析师,Fred总是在寻找流程改进。这就是他的工作,而且他做得很好。他听过很多关于数据科学的议论,但对他来说,那就像是嘈杂的嗡嗡声。数据科学正在创造自动驾驶汽车、在围棋比赛中击败世界冠军、进行语言翻译。Fred为一家美国制造商工作,数据科学看起来与他没有真正的联系。

确实如此吗?

如果Fred了解数据科学的基本概念,他会明白如何利用它带来业务价值。他最近与产品研发团队合作,该团队希望IT部门帮助他们简化流程。他们有很多杂乱无章的数据。IT部门向Fred提出一个想法,即使用仪表盘帮助他们跟踪业务过程。当Fred对项目进行评估时,他的第一反应是将数据放入SQL数据库。在那里,他可以使用像PowerBI这样的演示工具来创建仪表盘。这是一个大家都喜欢的解决方案。

可是,Fred并不懂数据科学的基础知识。这些数据中的一些特征可能会帮助公司做出更好的、数据驱动的决策。如果他知道回归和聚类的基本概念,他就会明白这些。他应该知道,与项目团队要求的相比,他能利用这些业务数据做更多的事情。

这就是本章的重点所在。我们不是要创造数据科学家,我们只是尝试让业务分析师有一点数据科学家的思维方式,我们正在努力创造公民数据科学家。那些对数据科学有足够了解的业务分析师和专业人员也经常提出如何将数据科学应用到他们的数据中的问题,特别是对他们的SAP数据有用的情况。为此,我们需要介绍数据科学的基础知识,包括机器学习和神经网络等不同类型的学习模型。

接下来是对这个主题的快速介绍,至少会让你获得足够的信息,让你以稍微不同的方式(以一种数据科学的方式)思考业务流程。理想情况下,你会思考你的项目和数据,然后对你的数据科学家或开发人员说:“也许像朴素贝叶斯这样的分类算法可以解决这个问题。”想象一下,你的回答肯定让他们惊得下巴都掉下来!

这是一个概念性的章节,提供了主要数据科学概念的概述,因此我们不会讨论探索性数据分析(EDA)或数据准备等战术思想。我们已经涵盖了我们认为最相关的主题,但人们很容易认为我们忽略了一些重要的东西,比如自动机器学习(autoML)和集成方法。然而,我们必须在某个地方划出一条线来保持这一章的可管理性。尽管如此,我们稍后还会讨论一些战术概念,比如第4章中讨论的探索性数据分析(EDA)。 IuChGIviSP6BZyLOoA8brC7Ju2Vrpoz3ryexxuVgLvBhZdobQ3zVdh9jBHVK0dB/

点击中间区域
呼出菜单
上一章
目录
下一章
×