购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

实验二
描述数据的图表方法

一、实验目的及要求

(一)实验目的

培养学生处理数据的基本能力。通过软件辅助,将数据转化成为直观的统计表和生动形象的统计图。

(二)实验要求

(1)熟练掌握Microsoft Excel的统计制表功能。

(2)熟练掌握Microsoft Excel的统计制图功能。

(3)掌握各种统计图表的功能,并能准确地根据不同对象的特点加以应用。

二、分类数据的图表

(一)汇总表

汇总表列出了一系列分类数据的次数、频率、总数或百分比,可以直接看出不同类型数据间的区别。汇总表通常会在第一列内列示出分类的不同情况,然后分别用其他列列示次数、频率、百分比等内容。下面我们用一个例子来说明如何构建汇总表。

某次市场调研中,观察员随机记录了20位消费者的性别和消费饮料类型的数据并录入Microsoft Excel工作表,如图1-2-1所示。选中激活B1:C21单元格,点击“插入-数据透视表”菜单,打开“创建数据透视表”对话框,如图1-2-2所示。

图1-2-1 分类汇总原始数据(例)

图1-2-2 “创建数据透视表”对话框

将选择放置“数据”透视表的位置定位于现有工作表的一个右侧和下侧没有数据的单元格(如F1)后,点击“确定”按钮,软件将从F1单元格开始,向右下方占用单元格显示空白数据透视表,并在表格右侧显示“数据透视表字段”设置区域,如图1-2-3所示。接下来,只需要把“数据透视表字段”设置区域的标志名称,用鼠标拖动到下方的相应的布局区域中,就可以实现对定性数据的分类汇总统计。比如,将性别标志拖动到列区域,将饮料类型拖动到行区域,同时将饮料类型拖动到∑值区域,就能实现不同性别消费不同类型饮料的分类汇总,如图1-2-4所示。

图1-2-3 数据透视表空白设置区

图1-2-4 数据透视表设置结果

(二)柱状图(或条形图)

柱状图能在不同类别数据间进行比较,在柱状图中,每个柱代表一个分类,其长度表示该分类的总数、频数。条形图也具有类似的功能,不过条形图通常是水平的,而柱状图通常是垂直的。

比如,我们可以利用图1-2-4数据透视表所得到的分类汇总数据,做出柱状图,步骤如下:

第一步,选中F3:F6以及I3:I6单元格(按住Ctrl键可以帮助你在Excel中选择不连续的单元格),在“插入”菜单下找到图表卡片集,点击其中的“插入柱形图或条形图”按钮(或点击这个按钮的下拉箭头,选择子图,如选择二维柱形图),就能初步得到柱状图,如图1-2-5所示。如果对图形的细节不满意,还可以在图形处于选中(激活)状态时,通过“设计”菜单来调整图形的坐标、网格线、图形名称、图例、柱体颜色(或样式)、在图形中显示数据内容以及更改子图等。

图1-2-5 插入柱形图

小贴士:“设计”菜单

Microsoft Excel的“设计”菜单,只有在图形处于激活状态时才能够显示,否则你在单元格界面是找不到这个菜单的。所以,选中图形是调用“设计”菜单的前提。

(三)饼图(或圆环图)

饼图是将一个圆饼分割成几部分,表示不同类别。圆饼每部分的大小因其分类数据的百分比不同而不同,一般用来表示频率的大小。圆饼本身代表100%,分割部分的大小占圆饼的面积代表各个分类的频率。圆环图与饼图类似,能发挥反映现象结果的作用。圆环图中间有一个空洞,用“环段”代表分类,环段对应的面积对比反映各个分类的频率。

将图1-2-4数据透视表所得到的分类频数,进一步处理得到每组的比重数据,如图1-2-6所示。每组比重的计算,可以调用单元格地址,用“每组频数/所有组频数之和”的基础公式计算。比如,针对“纯水”组,可以激活O2单元格,输入公式“=N2 /SUM($N$2:$N$5)”,回车就可以计算出“纯水”组的比重了。

小贴士:SUM函数

用途:返回某一单元格区域中数字、逻辑值及数字的文本表达式之和。

语法:SUM(number1,number2,…)或者SUM(列名)

参数:number1,number2,…为1到30个需要求和的参数。

举例:激活一个单元格,在其中输入“=SUM(20,30)”,回车,返回结果为50。

选中M1:M5以及O1:O5单元格,在“插入”菜单下找到图表卡片集,点击其中的“插入饼图或圆环图”按钮(或点击这个按钮的下拉箭头,选择子图,如选择二维饼图),就能初步得到饼图,经过“设计”菜单修饰后,最终如图1-2-7所示。

图1-2-6 频数分布表(例)

图1-2-7 饼图示例结果

三、数值数据的图表

(一)频数频率表

频数频率表也是一种汇总表,是将数值型数据分成有序组。频数频率表必须注意选择合理的组数,确定合理的组宽,确定每组的组限边界以避免重复。这些软件没有办法帮你决定,软件只能帮你实现你决定了这些合理条件以后的频数频率表展示。

Microsoft Excel提供了两种获取频数频率表的方式,一是使用Frequency函数,二是使用“直方图”分析工具扩展函数。这里我们举例介绍Frequency函数获取频数频率的方法,“直方图”分析工具扩展函数放到下一点中去介绍。

比如,已经知道甲企业十四名工人的月工资数据:2220,2600,2500,2520,2100,2880,2640,2540,2320,2680,2560,2220,2200,2140,希望得到2000~2200,2200~2600,2600 ~3000三组的频数频率情况,步骤如下:

第一步,将数据输入到A1:A14单元格。在B1:B3单元格输入2199、2599、2999。

第二步,激活D2:D4单元格,点击函数调用卡片 打开“插入函数”对话框,在选择类别下拉框中选中“统计”,在选择函数框中选择“Frequency”函数,并观察其函数语法及功能,如图1-2-8所示。

图1-2-8 “插入函数”对话框-Frequency函数

第三步,点击“确定”按钮进入“函数参数”对话框。Data_array代表需分组的原始数据,可点击右侧箭头,选中A1:A14单元格;Bins_array代表分组依据,可点击右侧箭头,选中B1:B3单元格,如图1-2-9所示。

图1-2-9 “函数参数”对话框

第四步,使用组合键“Ctrl+Shift+Enter”,得到频数返回结果,如图1-2-10所示。

第五步,对结果进行修饰,加入分组标志及其值,再加入频数的具体名称,并且计算频率。在C1单元格输入“工人月工资(元)”;在D12单元格输入“工人数”;C2至C4单元格分别输入“2000-2200”“2200-2600”“2600-3000”;E1单元格输入“比率”;E2单元格输入公式“=D2 /SUM($D$2:$D$4)”,回车后,再次激活E2单元格,使用拖拉权柄至D4单元格;选中D2至D4单元格,鼠标右键选择“设置单元格格式”打开对话框,在“设置单元格格式”对话框的“数字”卡片下选择“百分比”,设置小数位为0,点击“确定”。最终处理结果如图1-2-11所示。

图1-2-10 Frequency函数频数返回结果

图1-2-11 Frequency函数频数频率表

小贴士:Frequency函数

用途:以一列垂直数组返回某个区域中数据的频数分布。它可以计算出在给定的值域和接收区间内,每个区间包含的数据个数。

语法:FREQUENCY(data_array,bins_array)

参数:data_array是用来计算一个数组的频率,或对数组单元区域的引用。bins_array是数据接收区间,为一数组或对数组区域的引用,设定对data_array进行频率计算的分段点。

举例:如果A1=2,A2=5,A3=8,A4=11,A5=12,A6=19,A7=21,A8=32,A9=45,A10=48,B1=10,B2=20,B3=30,B4=40,选中C1至C5单元格,输入“=FREQUENCY(A1:A10,B1:B4)”,然后使用“Ctrl+Shift+Enter”输入该公式作为数组公式。返回C1=3,C2=3,C3=1,C4=1,C5=2。

注意:① Frequency函数返回多个结果(结果的个数等于分组的组数),因此要事先激活一列上大于等于返回结果个数的单元格。②要同时返回多个结果,必须使用组合键“Ctrl+Shift+Enter”,仅使用Enter或点击函数对话框的确定按钮,只能得到第一个分组的频数。③bins_array可以选中单元格中预先设置的分组条件,也可以直接输入分组条件,输入的方法是{;;}。④Frequency函数按组距的上限分组,当相邻组限重叠时,输入的数据为比每组上限少1的数据,不接受非数值字符的分组。

(二)直方图

一般直方图的X轴表示不同的值,Y轴表示每组的频数(或频率)。每组数值数据的频数(或频率)表示成独立直条,临近直条之间没有间隔(因为横轴代表的数值分组数值连续且无遗漏),直条的宽度代表对应组的组距。仍然以甲企业十四名工人的月工资数据2220,2600,2500,2520,2100,2880,2640,2540,2320,2680,2560,2220,2200,2140,按2000~2200,2200~2600,2600~3000分成三组为例,调用“直方图”分析工具扩展函数,步骤如下:

第一步,将数据输入到A1:A14单元格。在B1:B3单元格输入2199、2599、2999。

第二步,使用“数据-数据分析”菜单,打开“数据分析”对话框,选择“直方图”,如图1-2-12所示。

图1-2-12 数据分析-直方图

第三步,单击“确定”按钮,进入“直方图”分析工具库对话框。输入区域点击右侧箭头选择A1至A14单元格;接收区域点击右侧箭头选择B1至B3单元格;输入区域不包含标志名称,所以不选择“标志”复选框;输出选项可以有输出区域、新工作表、新工作簿三个可供选择,这里我们选中输出区域,点击右侧箭头选择一个当前工作表中右侧和下侧没有数据的单元格(否则原工作表中的数据可能会被覆盖),比如F1;选中“图表输出”复选框,如图1-2-13所示。

图1-2-13 “直方图”分析工具库对话框

小贴士:直方图工具中的柏拉图和累计百分率

在图1-2-13中,输出选项中还有两个复选框“柏拉图”和“累积百分率”。当选中“累积百分率”复选框以后,输出结果中的频数表会多出一列,用来显示各组累计频率(或百分数)值;输出结果中的图形会多出一条折线表示累计百分比变化。当选中“柏拉图”复选框以后,输出结果中的频数表会将分组按出现频数结果的大小按降序排列,输出结果中的图形就变成了一般我们所说的“帕累托图”。

帕累托图是进行优化和改进的有效工具,反映的是帕累托原则。当绝大部分数据分布在很少类别中,剩下极少数据分散在大部分类别中时,我们调整和控制那些很少的类别就能起到较好的修正效果,这就是帕累托原则,也即我们经常说的“至关重要的极少数”和“微不足道的大多数”。帕累托图能从“微不足道的大多数”区分出“至关重要的极少数”,从而使你更关注于重要的类别。

第四步,单击“确定”按钮,得到直方图分析工具扩展函数的返回结果。如图1-2-14所示,结果由两个部分构成,一个部分是返回的频数表,另一个部分是一个名为“直方图”的图形。

图1-2-14 直方图分析工具返回结果

第五步,对结果进行修饰。显然,在1-2-14所示的结果中,有两个地方不够令人满意。一是返回的频数表示以“接收”为标志和分组的表达不符合一般的表述方式且多出了一行其他,频率标志下的数据其实是频数;二是直方图不符合“临近直条之间没有间隔”的特点。我们可以对频数表进行类似Frequency函数第五步的处理。对于直方图的修正,首先要用鼠标左键点击激活其中一个直条;其次单击鼠标右键选择“设置数据系列格式”菜单打开“设置数据系列格式”对话框,把“分类间距”修改为0%(可以直接在数据区域输入,也可以鼠标拖动滑条至最左端),如图1-2-15所示;最后,还可以直接在直方图中修改图名、坐标名以及删除不必要的图例等,修饰的结果如图1-2-16所示。

图1-2-15 “设置数据系列格式”对话框

图1-2-16 直方图分析工具修饰结果

(三)折线图

当同时比较几组数值数据分组情况时,使用直方图很不方便,因为把一张直方图的直条添加到另一直方图中比较麻烦,展现的结果不便分析直方图。此时,可以用横轴做分组(通常使用组中值作为每组代表值计入横轴),纵轴做每组的频数(或频率),构建折线图来描述数据。

比如,甲、乙两个企业各十四名工人的月工资资料如下(元):

甲企业:2220,2600,2500,2520,2100,2880,2640,2540,2320,2680,2560,2220,2200,2140;乙企业:2860,2800,2200,2800,2080,2060,2980,2420,2200,2900,2960,2580,2760,2240。

用折线图来反映两个企业工人月工资样本在2000~2200,2200~2400,2400~2800,2800~3000分组条件下的情况,步骤如下:

第一步:用前面频数频率表或直方图的方法获取两个企业工人月工资频率表,如图1-2-17所示。

第二步,选中D1至F5单元格,在“插入”菜单中找到“图表卡片集”,点击其中的“插入折线图或面积图”的下拉箭头,选择子图(如二维折线图),初步得到折线图。经过“设计”菜单,完成调整坐标名称、删除网格线、添加数据标签及调整图例等工作后,最终折线图结果如图1-2-18所示。

注意:作折线图或直方图时,为了不扭曲数据的特点,Y轴应该显示的是真实原点,X轴不需要显示原点,数据的范围应占据数轴的大部分区域。

图1-2-17 两组数据频率表

图1-2-18 折线图示例结果

(四)散点图

当有两组数值变量,并且想反映它们之间的可能关系,可以使用散点图。用X轴表示一个变量,用Y轴表示另外一个变量。比如,某企业产品产量与单位产品成本的数据如图1-2-19所示。

图1-2-19 散点图示例数据

选中激活A1至B11单元格,在“插入”菜单中找到“图表卡片集”,点击其中的“插入散点图或气泡图”的下拉箭头,选择子图(如散点图),初步得到散点图。经过“设计”菜单,完成调整图名、坐标名称、删除网格线等工作后,最终散点图结果如图1-2-20所示。由结果可以看出,产品产量和单位产品成本之间存在着明显的负相关关系。两组数值数据的关系,我们将在相关分析与回归分析实验中继续研究。

图1-2-20 产品产量与单位产品成本散点图示例结果

思考练习

1.一个分类变量有三类,各分类频数如下表所示:

(1)计算每一类的频率。

(2)绘制柱状图(或条形图)。

(3)绘制饼图。

2.以下数据代表50个随机调查消费者每月消费在A类商品上的金额(单位:元)。

(1)将上述数据录入Microsoft Excel工作表中,并保存工作簿文件名为“练习2.xls”。

(2)按小于100,100~110,110~120,120~130,130~140,140~150,150~160,160 ~170,170~180,180~190,190以上的分组条件,制作频数频率表。

(3)按照(2)中的分组条件制作直方图。

(4)A类商品的消费金额集中在哪个范围?

3.以下是十二对样本数据:

(1)将上述数据录入Microsoft Excel工作表中,并保存工作簿文件名为“练习3.xls”。

(2)作出X和Y的散点图。

(3)X与Y之间有什么关系? 96XKq+hiRtJivZW78qV7V1xZSy14+Lj+2IYYZp51gbOecTL6VJ43krX0lmboojpU

点击中间区域
呼出菜单
上一章
目录
下一章
×