购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

任务3-1 数据挖掘认知

任务导入

任务 使用Excel进行数据挖掘
实训情境:

Excel是微软公司开发的一种强大的数据处理工具,也是非常简单实用的数据挖掘工具,它具备函数、图表、数据分析、数据透视表以及规划求解等功能。我们可以使用Excel工具,实现简单的数据挖掘。

根据岗位工作内容,我们可提炼出典型实训活动,具体如下:

(1)连接本地主机;

(2)新建本地服务器;

(3)连接数据挖掘。

学习目标:

知识目标:

(1)了解Excel环境特点;

(2)掌握数据挖掘在Excel中的安装要点。

技能目标:

(1)独立完成数据挖掘插件的安装;

(2)独立完成本地主机的连接;

(3)独立完成本地服务器的连接。

思政目标:

(1)树立严谨、细致的实训态度;

(2)用正确的立场、观点和方法分析数据问题;

(3)用科学的思维处理数据挖掘。

学习导图:

实训任务

实训任务书

任务名称:_______________

任务功能:_______________

典型实训任务:_______________

注意事项:

1.请严格按照实训任务内容要求实践,不得随意更改实训流程。

2.完成实训内容后,请进行清单检查,完成请打钩。

学生签名:

情境描述

某店铺在开店初期计划做一定的推广,想测试推广后实现的利润是否有所增长以及增长幅度。在明确Excel数据挖掘功能后,现需要着手做好数据挖掘准备,以便为后续完成数据导入、分析、运行及生成报表等实训提供环境基础。

实训计划

对企业典型实训活动进行提取,并辅以学习知识点,组成新型实训计划。

实训流程图如图 3.1 所示。

(备注:实训流程图上方为该环节所需知识点,下方为项目实践活动。)

图3.1 实训流程图

典型实训活动一:环境配置

实训要点 1:准备SQL插件安装包材料

实训要点 2:准备安装插件至Excel中

实训任务:准备数据挖掘需要的SQL插件材料并安装,实现环境配置要求。

典型实训活动二:连接数据挖掘服务

实训要点 1:连接本地主机

实训要点 2:连接本地服务,新建本地服务器

实训要点 3:完成连接服务,能够正常实现数据挖掘功能

实训任务:完成数据挖掘本地服务器的新建与连接。

学习目标

本实训的学习目标如表 3.1 所示。

表3.1 学习目标

表3.1(续)

知识讲解

任务 认识数据挖掘
一、数据挖掘的定义

在数字经济时代,数据挖掘(data mining,简称DM)产生了极大的影响力,其主要原因是大量数据可以被广泛使用,且这些数据能被转换成有用的信息和知识。获取的信息和知识可以广泛应用于各个行业,如生产控制、市场分析、商务管理、工程设计和科学探索等。通过数据挖掘,我们可以从数据库提取有用的知识、规律或信息,并可以从不同角度观察或浏览。

数据挖掘在不同的认知角度有不同的观点定义。

从实训过程角度来看,数据挖掘是从存放在数据库、数据仓库或其他信息库中的大量数据中去挖掘有用的信息和知识的过程。

从原理角度看,数据挖掘就是从大量数据及文本中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具;是利用各种分析工具在海量数据中发现模型和数据之间关系的过程。这些模型和关系可以被企业用来分析风险、进行预测。

从使用目的的角度看,数据挖掘是通过仔细分析大量数据来揭示有意义的新的关系、模式和趋势的过程。它可以使用模式认知技术、统计技术和数学技术。

从因果角度看,数据挖掘是一个从大型数据库中提取以前不知道的可操作性信息的知识挖掘过程

二、数据挖掘人员具备的技能

(一)业务分析能力

企业产生了大量的业务数据,这些数据和由此产生的信息是企业的财富,它如实地记录了企业运作的状况。数据挖掘人员通过数据挖掘分析,能帮助企业发现业务的趋势,揭示已知的事实,预测未知的结果。这种分析能力已成为企业保持竞争力的必需能力。

(二)数据管理能力

经过数据挖掘的结果分析得到的数据知识,可以帮助企业进行决策、控制过程、管理信息、处理查询等。数据挖掘的数据库提供了数据管理技术,供数据挖掘人员进行数据集成、选择、提取等。这就需要数据挖掘人员具备一定的数据管理能力。

三、数据挖掘的现状及前景

数据挖掘技术已经开始在多媒体、计算机图形学、计算机网络乃至操作系统、软件工程等计算机科学的众多领域中发挥作用。特别是在计算机视觉和自然语言处理领域,数据挖掘已经成为最流行、最热门的技术之一,以至于在这些领域的顶级会议上相当多的论文都与数据挖掘技术有关。总的来看,引入数据挖掘技术在计算机科学的众多分支领域中都是一个重要趋势

(一)数据挖掘的应用范围

作为一门应用技术,数据挖掘可谓涵盖广泛,尤其在发达国家,数据挖掘技术的触角已经伸向了各行各业。企业只要拥有具有分析价值的数据源,就可利用数据挖掘工具进行有目的的挖掘分析。一般较常见的应用行业有零售业、制造业、财务金融保险业、通信业以及医疗服务业等。

数据挖掘的应用领域具体可以分为三类:

(1)商业与电子商务数据。银行、管理部门、网络应用在商业运作过程中产生了大量数据,这些行业需要通过数据分析做出有效的决策。

(2)科学、工程学和卫生保健数据。工程领域的数据往往比商业数据更复杂,此外,科学家和工程师越来越多地使用模拟系统。

(3)网络数据。网络上的数据不仅在数量上日益膨胀,在内容上也越来越复杂。网络数据不仅包括图像、文本,还包括数据流和数值数据。

(二)数据挖掘的发展前景

对于研究者来说,数据挖掘是一个充满潜力和机遇无限的研究领域。而且,由于数据挖掘能分析出数据中的有用信息,给企业带来了显著的经济效益,数据挖掘技术越来越普及。

美国Palo Alto管理集团公司对欧洲、北美和日本的 375 家大中型企业的数据挖掘技术的使用情况进行了调查。结果显示,在金融领域,数据挖掘技术的应用已经达到70%,在营销领域也达到 50%,并且在未来的数年中,各个应用领域对该技术的采纳水平都将提高约 50%。

英国电信要发布一种新的产品,通过直邮的方式向客户推荐这种产品,使用数据挖掘技术可以使直邮的回应率提高 100%; GUS日用品零售商店需要准确预测未来的商品销售量,降低库存成本,使用数据挖掘技术使库存成本比原来减少了 3.8%;汇丰银行需要对不断增长的客户群进行分类,针对每种产品找出最有价值的客户,使用数据挖掘技术使营销费用减少了 30%;美国国防部每年有上百万笔的军火交易,使用数据挖掘技术能够发现可能存在的欺诈交易,然后进行深入调查,这样节约了大量的调查成本

总之,未来若干年,数据挖掘将会成为极为重要的成长领域,数据挖掘的应用也会越来越广泛。研究结果显示,企业所处理的数据每五年就会呈倍数增长。

案例解析

NBA教练如何布阵以提升获胜机会?

美国著名的NBA教练,利用IBM公司提供的数据挖掘工具临场决定替换队员。如果你是NBA的教练,你靠什么带领你的球队取得胜利呢?当然,最容易想到的是全场紧逼、交叉扯动和快速抢断等具体的战术和技术。但是今天, NBA的教练又有了他们的新式武器:数据挖掘。

大约 20 支NBA球队使用了IBM公司开发的数据挖掘应用软件Advanced Scout系统来优化它们的战术组合。例如, Advanced Scout研究了魔术队队员不同的布阵安排,然后在魔术队与迈阿密热队的比赛中帮其找到了获胜的机会。

系统分析显示,魔术队先发阵容中的两个后卫安佛尼·哈德卫(Anfernee Hardaway)和伯兰·绍(Brian Shaw)在前两场中被评为负 17 分,这意味着他俩在场上,本队输掉的分数比得到的分数多 17 分。然而,当哈德卫与替补后卫达利尔·阿姆斯创(Darrell Armstrong)组合时,魔术队得分为正 14 分。

在下一场中,魔术队增加了阿姆斯创的上场时间。此招果然见效:阿姆斯创得到了 21 分,哈德卫得了 42 分,魔术队以 88 比 79 获胜。魔术队在第四场让阿姆斯创进入先发阵容,再一次打败了热队。在第五场比赛中,这个靠数据挖掘支持的阵容没能拖住热队,但Advanced Scout毕竟帮助魔术队赢得了打满 5 场,直到最后才决出胜负的机会。

Advanced Scout是一个数据分析工具,教练可以用便携式电脑在家里或在路上挖掘存储在NBA中心服务器上的数据。每一场比赛的数据都被统计分类,比如得分、助攻、失误等。时间标记让教练非常容易通过搜索NBA比赛的录像来理解统计发现的含义。例如:教练通过Advanced Scout发现本队的球员在与对方一个球员对抗时有犯规记录,他可以在对方球员与这个队员“头碰头”的瞬间分解双方接触的动作,进而设计合理的防守策略。

Advanced Scout的开发人,因德帕尔·布罕德瑞,开发该应用系统时正在IBM的Thomas J.Watson研究中心当研究员,他演示了一个技术新手应该如何使用数据挖掘。布罕德瑞说:“教练们可以完全没有统计学的知识,但他们可以利用数据挖掘制定策略”。与此同时,另一个正式的体育联盟——国家曲棍球联盟,正在开发自己的数据挖掘应用NHL-ICE,联盟与IBM建立了一个技术型的合资公司,推出了一个电子实时的比赛计分和统计系统。其在原理上是一个与Advanced Scout相似的数据挖掘应用,可以让教练、广播员、新闻记者及球迷挖掘NHL的统计。当访问NHL的Web站点时,球迷能够使用该系统循环看联盟的比赛,广播员可以挖掘统计数据。

回顾总结

知识总结:

把本节课的知识梳理汇总成流程图,如图 3.2 所示。

图3.2 本节知识流程图

思维导图:

整理本节课所学知识点,补充下方思维导图(如图 3.3 所示),管理你的知识。

图3.3 本节知识思维导图

实训作业

活动 连接数据挖掘服务
实训目标

通过此活动的实践,学生应当能够:

●连接本地主机;

●连接本地服务,新建本地服务器;

●连接数据挖掘。

实训实施流程 (如图 3.4 所示)

图3.4 实训实施流程

活动要求

1.根据实践任务要求,完成数据挖掘的连接服务。

2.在实训实施过程中,学生可自由查阅资料或向老师求助。

3.在规定时间内完成任务,超时则视为未完成任务,不予评分。

请先下载“参考资料”,根据实训步骤演示,在“答题卡”中完成任务。

任务实践

请根据活动步骤流程,连接数据挖掘服务功能,并将完成过程体现在下方表格中。

检查清单 (见表 3.2)

表3.2 检查清单

任务评价 (见表 3.3)

表3.3 任务评价表 5s+S59TAwTfNfdLFPN0Gbz0+iCIDetnzqrN6GsU5YUAumkCMlJDcl06eZdnOyBZb

点击中间区域
呼出菜单
上一章
目录
下一章
×