购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

项目学习

任务一
了解商业智能

在信息化飞速发展的今天,企业内外部的各类信息系统都积累了大量的数据。这些数据是企业的重要资产,其中蕴含了许多有价值的信息。如何从数据中充分挖掘有价值的信息,提高决策水平,满足不同层次、不同部门和行业应用的需求,已经成为各类组织关注的焦点。商业智能(Business Intelligence,BI)可以把各种数据及时转换为有价值的信息,帮助决策者做出正确的决策。

子任务一商业智能的定义

从20世纪90年代开始,商业智能已经被众多企业广泛关注。商业智能的概念最早由高德纳咨询公司的分析师霍华德·德雷斯纳(Howard Dresner)于1996年提出,他认为商业智能描述了一系列的概念和方法,可以应用基于数据的分析系统辅助商业决策的制定。商业智能技术为企业提供了迅速收集、分析数据的方法,可以把这些数据转化为有用的信息,提高企业决策的质量。

65841-00-014-1

微课1-1-1

微软公司认为:商业智能是指任何尝试获取、分析企业数据,以便更清楚地了解市场和客户,改进企业流程,更有效地参与竞争的过程。商业智能是下列软件工具的集合:终端客户查询和报告工具、在线分析处理工具、数据挖掘软件、数据集市、数据仓库(Data Warehouse,DW)产品和主管信息系统。

甲骨文公司认为:商业智能是一种商务战略,能够持续不断地对企业的经营理念、组织结构和业务流程进行重组,实现以客户为中心的自动化管理。

SAP公司认为:商业智能是指收集、存储、分析和访问数据,以帮助企业更好地做出决策的技术。

IBM公司认为:商业智能是一系列技术支持的简化信息收集、分析过程的策略集合。

帆软公司认为:商业智能是利用数据仓库、数据可视化与分析技术,将指定的数据转化为信息和知识的解决方案,其价值体现为满足企业不同人群对数据查询、分析和探索的需求,使企业实现对业务的监测和洞察,从而支撑企业管理决策,提升企业管理水平,提高企业业务运营效率。

从以上观点可以看出,商业智能是融合了先进信息技术与创新管理理念的结合体,集成了企业内外的数据,加工处理并从中提取能够创造商业价值的信息和知识,面向企业战略并服务于管理层、业务层,指导企业经营决策,提升企业竞争力。

各界对商业智能的定义都倾向于从技术、应用的角度,更多的是从商业智能的过程去描述并理解商业智能。所以,商业智能不仅是指一套技术,更是一套完整的解决方案,商业智能的本质就是数据智能。

子任务二商业智能的系统架构

65841-00-014-2

微课1-1-2

商业智能需要将企业积累的大量数据处理成信息,再转化为知识,最后通过可视化方式将信息和知识展现给企业相关人员,便于企业进行商务决策。一个完整的商业智能系统架构体系包括数据获取层、数据管理层、数据分析层和数据展示层,如图1-1所示。

65841-00-014-3

图1-1 商业智能系统架构体系

1. 数据获取层

商业智能的基础是数据。获取什么样的数据及如何获取数据,是商业智能系统数据获取层的主要工作内容。

从数据来源看,数据获取层中的数据通常包括企业内部的数据和企业外部的数据。企业内部的数据包括来自财务系统、采购系统、销售系统、生产系统等ERP系统的数据,以及办公自动化系统(OA)的数据。企业外部的数据包括政策数据、市场数据、行业数据、竞争对手的数据、各类统计数据等。

从数据存储结构上看,数据获取层中的数据分为结构化数据和非结构化数据两种。结构化数据主要是以二维表格形式存储的数据。非结构化数据主要包括所有格式的办公文档、文本、图片、音频和视频文件等。

从数据存储形式上看,数据获取层中的数据包括.xlsx文件、.txt文件、.csv文件和各类数据库文件等。目前的商业智能系统都能直接读取并连接各种类型的结构化数据。

商业智能系统获取数据后,还要经过数据清洗操作。数据清洗是商业智能分析过程中重要的一个环节。

2. 数据管理层

数据管理层主要通过数据仓库和元数据(Metadata)管理方式实现对数据的管理。

经过ETL处理的数据被加载到数据仓库中。数据仓库是面向主题的,其中的数据按照一定的主题域进行组织。主题是指客户使用数据仓库进行决策时所关心的重要方面。一个主题通常与多个操作型信息系统相关。数据仓库是集成的,有些数据来自分散的操作型数据,系统需要将这些数据从原来的数据中抽取出来,进行加工与集成,然后才能进入数据仓库。数据仓库中的数据是在对原有分散的数据进行抽取、清理的基础上,经过系统加工、汇总和整理得到的。数据分析人员必须消除元数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下都将被长期保留。也就是说,数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期加载、刷新即可。数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到当前各个阶段的信息。通过这些信息,管理人员可以对企业的发展历程和未来趋势做出定量分析和预测。

为了便于管理数据仓库中的数据,我们引入了元数据的概念。元数据是指在数据仓库建设过程中所产生的与数据源定义、目标定义和转换规则等相关的关键数据。同时,元数据还包含关于数据含义的商业信息,所有这些信息都应当妥善保存,并很好地管理,为数据仓库的发展和使用提供方便。

3. 数据分析层

数据分析层主要包括联机分析处理(Online Analytical Processing,OLAP)和数据挖掘(Data Mining,DM)两种分析工具。联机分析处理与数据挖掘是相辅相成的,它们都是进行决策分析不可缺少的工具。

联机分析处理是以海量数据为基础的复杂分析技术。它支持各级管理决策人员从不同的角度、快速灵活地对数据仓库中的数据进行复杂查询和多维分析处理,并且能以直观易懂的形式将查询和分析结果展现给决策人员。联机分析处理使用的逻辑数据模型为多维数据模型。数据挖掘是从海量数据中提取隐含在其中的、人们事先不知道但又可能有用的信息和知识的过程。数据挖掘的数据有多种来源,包括数据仓库、数据库或其他数据源。

从上述定义可以看出,联机分析处理是验证型分析工具,而数据挖掘是预测型分析工具。

4. 数据展示层

数据展示层主要是通过可视化技术将分析内容以各种图表的方式展示出来,供企业决策人员、管理人员、分析人员、业务人员等相关人员进行洞察和决策。可视化技术是以图像处理技术为基础,将数据转换为图形或图像形式,显示到屏幕上,并进行交互处理的理论方法和技术。它涉及计算机视觉图像处理、计算机辅助设计、计算机图形学等多个领域,并逐渐成为一种研究数据表示、数据综合处理、决策分析等一系列问题的综合技术。企业数据分析的内容包括利润分析、收入分析、成本分析、资产分析、运营分析、投融资分析等,需要展示哪些指标和内容,与企业战略、经营管理需要有密切关系。

子任务三商业智能的应用价值

商业智能可以帮助管理者减少收集、处理信息的时间,把更多精力用于决策上。商业智能的应用价值主要体现在以下几个方面。

1. 增强业务洞察能力

商业智能可以加速决策过程,使正确的信息于正确的时间在信息系统中流向各类相关人员。管理者通过监控关键绩效指标(Key Performance Indicator,KPI),可以掌控业务执行的状况,以便及时调整策略。例如,管理者通过KPI监控销售人员最新的销售信息、任务额信息和任务完成度信息,可随时掌握企业的营收完成情况。

65841-00-016-1

微课1-1-3

2. 优化企业营销策略

企业通过构建商业智能分析模型,可以深入挖掘消费者行为,从而制定适当的营销策略。“啤酒和尿布”的故事,就是著名的零售企业沃尔玛通过商业智能分析发现了尿布销售额和啤酒销售额具有一定的相关性,于是管理层做出决策,将尿布和啤酒这两种看上去不相关的商品摆放在一起销售,从而提高企业的销售业绩。

小知识
“啤酒和尿布”的故事

沃尔玛的数据仓库中存储了各门店的详细原始交易数据。为了能够准确了解客户在各门店的购买习惯,沃尔玛在这些原始交易数据的基础上,利用数据挖掘技术对这些数据进行分析和挖掘。一个意外的发现是:跟尿布一起购买最多的商品竟是啤酒!经过大量实际调查和分析,揭示了美国人隐藏在“啤酒与尿布”背后的一种行为模式:在美国,一些年轻的爸爸下班后经常要到超市购买婴儿尿布,而他们中有30%~40%的人同时也会为自己买一些啤酒。产生这一现象的原因是:妈妈们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了他们喜欢的啤酒。

这就是著名的“啤酒和尿布”的故事。沃尔玛正是根据这一发现,及时调整营销策略,在尿布旁边摆放啤酒,从而大大增加了两种商品的销售收入。

3. 提高市场响应能力

企业借助商业智能的大数据整合能力,将行业信息、政策法规等信息融入商业智能系统,通过适当的模型以预测市场变化,精简流程,确定需要改进的环节,从而适应外部环境的变动。

4. 加强风险管理能力

企业可通过商业智能风险预警模型,发现企业存在的潜在风险,如经营风险、财务风险、纳税风险等。当出现这些风险预警时,企业可随时调整其经营策略来应对、规避、降低各类风险。例如,就贷款业务而言,银行可以应用数据挖掘技术对客户进行信用分析,发现其中的欺诈行为特征,作为有效的预警机制,为银行减少损失。

5. 改善客户关系管理

很多企业正在逐渐由“以产品为中心”转化为“以客户为中心”。企业应用商业智能中的在线分析处理和数据挖掘等技术,对客户的交易记录等相关资料进行处理与挖掘,并对客户行为进行分类,然后针对不同类型的客户制订相应的服务策略。这类应用就叫作“客户智能”。电信企业利用分析模型对客户行为、信用度等进行评估,对不同类型的客户提供有针对性的服务,从而提高客户的满意度和忠诚度。

子任务四商业智能的核心技术

65841-00-017-1

微课1-1-4

商业智能以大数据为基础,对这些数据进行ETL处理后,将其按一定方式存储在数据仓库中,再经过联机分析处理,从中挖掘出数据的价值。商业智能的核心技术包括以下3种。

1. ETL技术

ETL是将业务系统的数据经过抽取(Extract)、转换(Transform)之后加载(Load)到数据仓库的过程,目的是将企业中分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ETL是商业智能中的一个重要环节。ETL的过程如图1-2所示。

65841-00-017-2

图1-2 ETL的过程

(1)数据抽取。数据仓库中的数据是面向主题的,分析人员在将源数据导入数据仓库之前,需要识别出与分析决策相关的数据。抽取过程通常考虑以下几个方面:①确定源数据及其含义;②进行数据抽取,确定访问哪些数据库、文件和表;③确定抽取频率;④确定抽取数据保存的位置;⑤无法抽取时的异常处理。

(2)数据转换。数据转换就是将抽取的数据变成数据分析所需要的、完整的、准确的目标数据,主要包括数据清洗、格式转换、汇总计算等。数据清洗将从数据的准确性、完整性、一致性、唯一性、有效性几个方面来处理数据的缺失值、错误值、重复值、不一致等问题。

①缺失值的处理方法。这里的缺失值是指数据不完整。大多数情况下,缺失值必须手工补充填入(即手工清理)并与数据提供方进行确认。当无法得到数据提供方确认时,某些缺失值可以从本数据源或其他数据源推导出来,这就可以用平均值、最大值、最小值或更为复杂的概率估计代替缺失的值。如果缺失值很少且不影响数据分析,也可将缺失值记录直接删除。

②错误值的处理方法。错误值的产生大多是由于业务系统不够健全,在接收并输入数据后,没有进行判断直接写入后台数据库造成的,如字符串包含若干空格、日期格式不正确、日期越界等。产生错误值时,可以人工修改或用统计分析的方法识别可能的错误值或异常值,从而将其加以修正。

③重复值的处理方法。数据库中属性值相同的记录被认为是重复记录。重复的记录只保留一条即可,其余的记录可删除。

④不一致性数据的处理方法。从多个数据源集成的数据可能存在语义冲突,如性别字段中的“男性”,有的表中表示为“1”,有的表中表示为“男”。当数据出现不一致时,可定义完整性约束条件来检测不一致性,也可通过分析数据发现联系,从而使数据保持一致。

(3)数据加载。数据加载是将清洗和转换后的、符合数据分析要求的数据加载到数据仓库中。加载方式包括直接追加和全面覆盖两种。

2. 数据仓库技术

数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。数据仓库模型主要包括概念模型、逻辑模型和物理模型。概念模型通过主题来表达,用维和度量表示。逻辑模型也叫关系模型,用于确定关系模式的定义,如数据分割策略。物理模型是逻辑模型在数据仓库中的实现,如数据索引策略、数据的存储策略及存储优化分配等。下面重点介绍逻辑模型。

逻辑模型一般有两种,即星形模型和雪花模型。

(1)星形模型。星形模型由事实表和维度表组成,事实表可连接多种维度表,维度表只有一层。维度表和事实表必须有能够关联的字段。某公司采购业务数据的星形模型如图1-3所示。其中,采购订单表是事实表,包含企业实际发生的全部采购订单数据,通常记录数很多;而日期表、商品表、物流表、供应商表等都是维度表,其中的数据作为分析的维度,数据量较少。

65841-00-018-1

图1-3 某公司采购业务数据的星形模型

(2)雪花模型。雪花模型是星形模型的扩展,在事实表的外部有多层维度表。例如,将供应商表中的城市和省份字段拆分出来放入地区表中,再将地区表作为供应商表的维度表,这样做可以减少数据冗余。

在数据联机分析处理中,大多使用星形模型。

3. 联机分析处理技术

联机分析处理技术是使用最广的数据分析技术,它通过对数据仓库的多维分析,可以快速实现洞察并发现问题。联机分析处理中最主要的操作结构是数据立方体,它是一种支持快速数据分析的多维数据结构(实际的或虚拟的),能够进行多维度、高效率的操作和数据分析,如图1-4所示。分析人员通过改变数据位置和定义,可以在整个数据库中进行导航,并能提取数据的一个特定子集。常见的OLAP操作包括切片(Slice)、切块(Dice)、钻取(Drill-down)、上卷(Roll-up)和旋转(Pivot)等。

(1)切片操作是选择特定的维度值进行分析。例如,只选择东北地区的销售数据,或者只查看2024年度的销售数据,如图1-5所示。

65841-00-019-1

图1-4 数据立方体

65841-00-019-2

图1-5 切片

(2)切块操作是选择维度中特定区间的数据或某批特定值进行分析。例如,选择2023—2024年的销售数据,如图1-6所示。

65841-00-019-3

图1-6 切块

(3)钻取操作是在维度的不同层次间的变化,如从上层维度降到下层维度,或者将汇总数据拆分为更详细的数据。例如,对手机维度向下钻取,得到的数据立方体如图1-7所示。

65841-00-019-4

图1-7 钻取

(4)上卷操作是钻取的逆操作,即从低层维度向高层维度聚合。例如,将华为手机、小米手机和OPPO手机向上汇总。

(5)旋转即维度位置互换,类似二维表的行列转换。例如,将年份维度和地区维度互换,如图1-8所示。

65841-00-020-1

图1-8 旋转

子任务五自助式商业智能分析工具

自助式商业智能分析工具不再只面向IT部门的技术人员,而是面向更多不具备IT背景的业务、财务分析人员。与传统商业智能分析工具相比,自助式商业智能分析工具更灵活,并且更易于使用。下面介绍几种自助式商业智能分析工具。

65841-00-020-2

微课1-1-5

1. Power BI

Power BI是微软官方推出的可视化数据探索和交互式报告工具。Power BI能让静态数据转化为动态报表,是一个让非专业数据分析人员也可以有效整合企业数据,并快速准确地提供商业智能分析的数据可视化“神器”。

Power BI应用包括Windows桌面应用程序(Power BI Desktop)、云端在线服务(Power BI Online-Service)和移动端应用(Power BI Mobile)。

2. Tableau

Tableau是一个可视化分析平台,它改变了使用数据解决问题的方式,使个人和组织能够充分利用自己的数据。作为现代商业智能市场的领先产品,Tableau使人们能够更加轻松地探索和管理数据,更快地发现和共享各种有价值的见解。

Tableau是斯坦福大学一个计算机科学项目的成果。该项目旨在改善分析流程,并让人们能够通过可视化技术更轻松地使用数据。自成立以来,Tableau公司一直不断进行研发投资,开发各种解决方案来帮助所有需要使用数据的人更快地找到答案,发现意想不到的见解。Tableau在2019年被Salesforce收购,但其使命不变:帮助人们查看并理解自己的数据。

Tableau以其简单易用、极速高效、视图美观、轻松实现数据融合等优势,帮助人们使用数据推动变革,其家族产品包括Tableau Desktop、Tableau Server、Tableau Online、Tableau Public和Tableau Reader。

3. FineBI

FineBI是帆软软件有限公司推出的一款商业智能产品。业务人员使用该产品可以自主分析企业的信息化数据,帮助企业发现并解决存在的问题,协助企业及时调整策略,做出更好的决策,增强企业的可持续竞争力。FineBI定位于自助式大数据分析工具,能够帮助企业的业务人员和数据分析师开展以问题为导向的探索式分析。

FineBI产品的优势是:业务人员和数据分析师可以自主制作仪表板,进行探索分析。数据取自业务,并应用于业务,让需要分析数据的人可以自主处理、分析数据。

FineBI的系统构架包括4个部分。

(1)数据处理。数据处理服务用来对原始数据进行抽取、转换、加载,并为分析服务生成数据仓库FineCube。

(2)即时分析。业务人员和数据分析师可以快速创建图表使数据可视化,还可以添加过滤条件筛选数据并即时排序,使数据分析更加快捷。

(3)多维度分析。FineBI可以提供各种分析挖掘功能和预警功能,如任意维度切换、添加、多层钻取、排序、自定义分组、智能关联,等等。

(4)仪表盘(Dashboard)。仪表盘可以提供各种样式的图表服务,配合各种业务需求展现数据。

4. Smartbi

Smartbi是思迈特软件公司旗下的产品,可以满足客户对企业级报表进行数据可视化分析、自助分析、数据挖掘建模、AI智能分析等方面的需求。Smartbi在国内商业智能领域处于领先地位,产品广泛应用于金融、制造、零售、地产等众多行业。

Smartbi产品系列主要包括四大平台。

(1)大数据分析平台。大数据分析平台可以对接各种业务数据库、数据仓库和其他大数据分析平台,对数据进行加工处理、分析挖掘和可视化展现,满足客户的各种数据分析应用需求,如可视化分析、探索式分析、复杂报表、应用分享,等等。

(2)数据化运营平台。数据化运营平台可以围绕业务人员提供企业级数据分析工具和服务,满足不同类型业务客户的需求,还可以在Excel或者浏览器中实现全自助的数据提取、数据处理、数据分析和数据共享服务,具有很强的适用性。

(3)大数据挖掘平台。通过深度数据建模,大数据挖掘平台可以为企业提供预测能力支持、文本分析、五大类算法和数据预处理功能,并为客户提供流程式建模、拖曳式操作和可视化配置体验等一站式服务。

(4)SaaS分析云平台。SaaS分析云平台是全新一代云端数据分析平台,可以提供快速搭建数据分析应用的自助式服务,还可以分享深刻见解,提升团队的决策能力。 m9JqId4Ac+Dx7ui3gnuiC2zNJ2rGXBoRb1igPHbGZJm7jdHhRn+CU6lmod+Zr9iS

点击中间区域
呼出菜单
上一章
目录
下一章
×