购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.11 数据结构重组

下载资源:\video\第2章\2.11

下载资源:\sample\数据2\产品促销方案与销量数据一、产品促销方案与销量数据二

不同的分析方法需要不同的数据文件结构。当现有的数据文件结构与将要进行的分析所要求的数据结构不一致时,我们需要进行数据文件的结构重组。一般来说,数据文件的结构分为横向与纵向两种。横向结构的数据将一个变量组中的不同分类分别作为不同的变量。例如,在示例数据中将分别采用不同促销方案下的产品销量作为变量进行保存,每个省份是一个样本观测值,如图2.81所示。纵向结构的数据将一个变量组中的不同分类分别作为不同的样本观测值。例如,在示例数据中将每个省份在不同促销方案下的产品销量分别作为样本观测值,如图2.82所示。

图2.81 数据文件的横向结构

图2.82 数据文件的纵向结构

2.11.1 由变量组到样本观测值组的重组

1.选择数据重组方式及变量组个数

打开“产品促销方案与销量数据一”文件,单击“数据|重构”命令,弹出如图2.83所示的“重构数据向导”对话框。该对话框提供了3种数据重组方式,用户可以根据现有数据的组合方式和将要进行的分析来选择相应的数据重组方式。本例中选择“将选定变量重构为个案”。

单击“下一步”按钮,弹出如图2.84所示的“重构数据向导-第2/7步”对话框,在该对话框中选择要重构的变量组的个数。因为本例只有促销方案一个变量组,所以选中“一个”单选按钮。

图2.83 “重构数据向导”对话框

2.选择要重组的变量

单击“下一步”按钮,弹出如图2.85所示的“重构数据向导-第3/7步”对话框。

图2.84 “重构数据向导-第2/7步”对话框

图2.85 “重构数据向导-第3/7步”对话框

(1)“个案组标识”选项组。该选项组用于设置需要观测的标识变量,在下拉列表框中有3个选项:

● 使用个案号:若选择此项,系统会出现“名称”文本框和“标签”列表,用户可以设置重组后的序号变量的变量名和变量标签。

● 使用选定变量:若选择此项,系统会出现一个 按钮和一个“变量”列表。选择标识变量,单击 按钮将其选入“变量”列表框即可。

● 无,表示不使用标识变量。

本例中选择“无”。

(2)“要转置的变量”选项组:该选项组用于设置需要进行变换的变量组。“目标变量”下拉列表框用于指定要进行重组的变量组。

本例将prompt1、prompt2和prompt3变量选入“要转置的变量”列表框,在“目标变量”后的文本框中输入“销量”。

(3)“固定变量”列表框:如果用户不希望一个变量参加重组,只需选择该变量,单击 按钮将其选入“固定变量”列表框即可。本例中保持系统默认设置。

3.选择索引变量的个数

单击“下一步”按钮,弹出如图2.86所示的“重构数据向导-第4/7步”对话框。

该对话框用于设置重组后生成的索引变量的个数,可以选择一个或多个,也可以选择无,表示把索引信息保存在某个要变换重组的变量中,不生成索引变量。本例选择创建一个索引变量。

4.设置索引变量的参数

继续单击“下一步”按钮,弹出如图2.87所示的“重构数据向导-第5/7步”对话框。

图2.86 “重构数据向导-第4/7步”对话框

图2.87 “重构数据向导-第5/7步”对话框

(1)“索引值具有什么类型?”选项组:该选项组用于设置索引值的类型,用户可以选择连续数字或变量名作为索引值的类型。

(2)“编辑索引变量名和标签”栏:在该栏中设置索引变量的变量名和变量标签。

本例在“索引值具有什么类型?”选项组中选择“变量名”,并在下方的“编辑索引变量名和标签”栏中设置索引变量的名称为“促销方案”,其索引值为prompt1、prompt2和prompt3。

5.其他参数设置

单击“下一步”按钮,弹出如图2.88所示的“重构数据向导-第6/7步”对话框。

(1)“未选择的变量的处理方式”选项组:该选项组用于设置对用户未选择的变量的处理方式,如选中“从新数据文件中删除变量”单选按钮,系统会将这一部分变量删除;如选中“保留并作为固定变量处理”单选按钮,系统会将这一部分变量作为固定变量处理。

(2)“所有转置后的变量中的系统缺失值或空值”选项组:该选项组用于设置对要变换的变量中的缺失值和空白值的处理方式,如选中“在新文件中创建个案”单选按钮,表示系统将为这些变量单独生成观测记录;如选中“废弃数据”单选按钮,则这一部分观测值将被删除。

(3)“个案计数变量”选项组:该选项组用于设置是否生成计数变量,勾选“计算由当前数据中的个案创建的新个案的数目”复选框,则表示生成计数变量,同时将激活“名称”和“标签”文本框,用户可以在其中输入计数变量的名称和标签。在本例中,该步保持默认设置即可。

6.完成数据重组

单击“下一步”按钮,弹出如图2.89所示的“重构数据向导-完成”对话框。

图2.88 “重构数据向导-第6/7步”对话框

图2.89 “重构数据向导-完成”对话框

这里可选择是否立即进行数据重组,如选中“将本向导生成的语法粘贴到语法窗口中”单选按钮,系统会将相应的命令语句粘贴至语法窗口。设置完成后,单击“完成”按钮即可进行数据重组操作,横向格式的数据文件就会被转换成纵向格式的数据文件。

2.11.2 由样本观测值组到变量组的重组

本小节以“产品促销方案与销量数据二”为例,说明由样本观测值组到变量组的重组,使数据由纵向格式转换为横向格式。具体操作步骤如下:

选择重组变量。在前述“重构数据向导”对话框中选中“将选定个案重构为变量”单选按钮,单击“下一步”按钮,弹出如图2.90所示的“重构数据向导-第2/5步”对话框。

从“当前文件中的变量”列表框中选择在重组后将在数据集中标识观测记录的变量,单击 按钮将其选入“标识变量”列表框;选择构成新数据集中变量组的变量,单击 按钮将其选入“索引变量”列表框。

图2.90 “重构数据向导-第2/5步”对话框

本例将province变量选入“标识变量”列表框,将“促销方案”变量选入“索引变量”列表框。

原始数据的排序设置。单击“下一步”按钮,弹出如图2.91所示的“重构数据向导-第3/5步”对话框。该对话框用于设置是否对原始数据进行排序,选中“是”单选按钮,系统会在数据重组之前按照标识变量和索引变量对原始数据进行排序;选中“否”单选按钮,则不进行此项操作。本例选中“是”单选按钮。

新变量的相关参数设置。单击“下一步”按钮,弹出如图2.92所示的“重构数据向导-第4/5步”对话框。

图2.91 “重构数据向导-第3/5步”对话框

图2.92 “重构数据向导-第4/5步”对话框

(1)“新变量组的顺序”选项组:用于设置新变量组中变量的排序方式,有“按原始变量进行分组”和“按索引分组”两种。

(2)“个案计数变量”选项组:设置是否生成计数变量,如勾选“计算当前数据中用来创建新个案的个案数”复选框,则表示生成计数变量,同时激活“名称”和“标签”文本框,用户可以在其中输入计数变量的名称和标签。

(3)“指示符变量”选项组:设置是否生成指示变量,如勾选“创建指示符变量”复选框,表示对索引变量的每个取值生成一个指示变量,用于记录对应的变量取值是否为空值,用户可以在“根名称”文本框中输入指示变量的前缀。

本例保持默认设置即可。

完成数据重组。继续单击“下一步”按钮,弹出“重构数据向导-完成”对话框。单击“完成”按钮即可进行数据重组操作,数据就会由纵向格式转换为横向格式。 AllXAAWEd/gdyF3NyFrUeT8nYp2lN0BYAsz2meWJEP++z9P7ID1CVxoKa2QUgI+F

点击中间区域
呼出菜单
上一章
目录
下一章
×