不同的分析方法需要不同的数据文件结构,当现有的数据文件结构与将要进行的分析所要求的数据结构不一致时,我们需要进行数据文件的结构重组。一般来说,数据文件的结构分为横向与纵向两种结构。
横向结构的数据将一个变量组中的不同分类分别作为不同的变量,例如,在示例数据中将施用不同化肥下的作物产量分别作为一个变量进行保存,每一个试验组是一个观测量,如图2-72所示。
纵向结构的数据将一个变量组中的不同分类分别作为不同的观测量,例如,在示例数据中将每一个试验组在不同肥料作用下的产量分别作为一个观测量,如图2-73所示。
图2-72 数据文件的横向结构
图2-73 数据文件的纵向结构(产量单位:千克/亩)
本节以施用不同类型肥料的作物的产量为例讲解数据文件的结构重组,图2-72和图2-73给出了该数据文件的两种不同的保存方式。
在菜单栏中选择“数据”|“重构”命令,打开如图2-74所示的“重构数据向导”对话框。
该对话框提供了3种数据重组方式,分别是“将选定变量重构为个案”“将选定个案重构为变量”和“转置所有数据”,用户可以根据现有数据的组合方式和将要进行的分析来选择相应的数据重组方式。
图2-74 “重构数据向导”对话框
变量组到观测量组的重组将会使数据由横向格式转换为纵向格式,首先打开横向格式保存的数据文件,如图2-72所示。
(1)选择变量组个数。在图2-74所示的“重构数据向导”对话框中选中“将选定变量重构为个案”单选按钮,单击“下一步”按钮,弹出如图2-75所示的“重构数据向导-第2/7步”对话框,在该对话框中选择要重组的变量组的个数。因为本例只有施肥类型一个变量组,所以选中“一个(例如,w1、w2和w3)”单选按钮。
(2)选择要重组的变量。单击“下一步”按钮,弹出如图2-76所示的“重构数据向导-第3/7步”对话框。
图2-75 “重构数据向导-第2/7步”对话框
图2-76 “重构数据向导-第3/7步”对话框
①“个案组标识”选项组:该选项组用于设置对观测记录的标识变量,在下拉列表框中有3个选择项:
使用个案号,选择此项系统会出现“名称”文本框和“标签”列表,用户可以设置重组后序号变量的变量名和变量标签。
使用选定变量,选择此项系统会出现一个 按钮和“变量”列表,选择标识变量,单击 按钮将其选入“变量”列表框即可。
无,表示不使用标识变量。
②“要转置的变量”选项组:该选项组用于设置需要进行变换的变量组。“目标变量”下拉列表框用于指定要进行重组的变量组。指定完成后,选择相应变量,单击 按钮将其选入“目标变量”列表框,组成要变换的变量组。
③“固定变量”列表框。如果用户不希望一个变量参加重组,只需要选择该变量,单击 按钮将其选入“固定变量”列表框即可。
在本例中将“使用肥料A产量”“使用肥料B产量”和“使用肥料C产量”变量选入“要变换的变量”列表框,在“目标变量”后的文本框中输入“产量”。
(3)选择索引变量的个数。单击“下一步”按钮,弹出如图2-77所示的“重构数据向导-第4/7步”对话框。该对话框用于设置重组后生成的索引变量的个数,可以选择一个或多个,也可以选择无,表示把索引信息保存在某个要变换重组的变量中,不生成索引变量。本例选择创建“一个”索引变量。
(4)设置索引变量的参数。继续单击“下一步”按钮,弹出如图2-78所示的“重构数据向导-第5/7步”对话框。
图2-77 “重构数据向导-第4/7步”对话框
图2-78 “重构数据向导-第5/7步”对话框
“索引值具有什么类型”选项组:该选项组用于设置索引值的类型,用户可以选择连续数字或变量名作为索引值的类型。
“编辑索引变量名和标签”栏:在该栏中设置索引变量的变量名和变量标签。
本例设置索引变量的名称为“施肥类型”,“索引值”为变量名,即“肥料A、肥料B、肥料C”。
(5)其他参数的设置。单击“下一步”按钮,弹出如图2-79所示的“重构数据向导-第6/7步”对话框。
“未选择的变量的处理方式”选项组:该选项组用于设置对用户未选定变量的处理方式,如选中“从新数据文件中删除变量”单选按钮,系统会将这一部分变量删除;如选中“保留并作为固定变量处理”单选按钮,系统会将这一部分变量作为固定变量处理。
“所有转置后的变量中的系统缺失值或空值”选项组:该选项组用于设置对要变换变量中的缺失值和空白值的处理方式,如选中“在新文件中创建个案”单选按钮,表示系统将为这些变量单独生成观测记录;如选中“废弃数据”单选按钮,则这一部分观测值将被删除。
“个案计数变量”选项组:该选项组用于设置是否生成计数变量,选中“计算由当前数据中的个案创建的新个案的数目”复选框,表示生成计数变量,同时将激活“名称”和“标签”文本框,用户可以在其中输入计数变量的变量名和变量标签。在本例中,该步保持默认设置即可。
(6)完成数据重组。单击“下一步”按钮,弹出如图2-80所示的“重构数据向导-完成”对话框。
图2-79 “重构数据向导-第6/7步”对话框
图2-80 “重构数据向导-完成”对话框
这里可选择是否立即进行数据重组,如选中“将本向导生成的语法粘贴到语法窗口中”单选按钮,系统会将相应的命令语句粘贴至语句窗口。
设置完成后,单击“完成”按钮即可进行数据重组操作。重组后的数据文件如图2-73所示,横向格式的数据文件转换成了纵向格式的数据文件。
观测量组到变量组的重组使数据由纵向格式转换为横向格式,具体操作步骤如下:
选择重组变量。在图2-74所示的“重构数据向导”对话框中选中“将选定个案重构为变量”单选按钮,单击“下一步”按钮,弹出如图2-81所示的“重构数据向导-第2/5步”对话框。从“当前文件中的变量”列表框中选择在重组后将在数据集中标识观测记录的变量,单击 按钮将其选入“标识变量”列表框;选择构成新数据集中变量组的变量,单击 按钮将其选入“索引变量”列表框。本例将“观测组别”变量选入“标识符变量”列表框,将“产量”变量选入“索引变量”列表框。
图2-81 “重构数据向导-第2/5步”对话框
原始数据的排序设置。单击“下一步”按钮,弹出如图2-82所示的“重构数据向导-第3/5步”对话框。该对话框用于设置是否对原始数据进行排序,选中“是”单选按钮,系统会在数据重组之前按照标识变量对原始数据进行排序;选中“否”单选按钮,则不进行此项操作。本例选中“是”单选按钮。
新变量的相关参数设置。单击“下一步”按钮,弹出如图2-83所示的“重构数据向导-第4/5步”对话框。该对话框中各选项组介绍如下:
图2-82 “重构数据向导-第3/5步”对话框
图2-83 “重构数据向导-第4/5步”对话框
“新变量组的顺序”选项组:用于设置新变量组中变量的排序方式,有“按原始变量进行分组”和“按索引分组”两种。
“个案计数变量”选项组:设置是否生成计数变量,如选中“计算当前数据中用来创建新个案的个案数”复选框,则表示生成计数变量,同时激活“名称”和“标签”文本框,用户可以在其中输入计数变量的变量名和变量标签。
“指示符变量”选项组:设置是否生成指示变量,选中“创建指示符变量”复选框,表示对索引变量的每个取值生成一个指示变量,用于记录对应的变量取值是否为空值,用户可以在“根名”文本框中输入指示变量的前缀。
本例选择默认设置即可。
完成数据重组。继续单击“下一步”按钮,弹出“重构数据向导-完成”对话框。
在图2-74“重构数据向导”对话框中选中“转置所有数据”单选按钮,单击“完成”按钮,则弹出图2-30所示的“转置”对话框。
该对话框的形式和设置方式与2.5.4节“数据文件的变换”中完全相同,读者可以参考该节,在此不再赘述。