外语教学与研究量化分析自我管理最新章节_任正来著

第三节
数据重构

数据重构，即对数据变量和记录位置互换。

数据重构，就是选择类型。

一共三种类型：

一是重构变量为记录。如果有几组有联系的纵格数据，要求纵格数据出现在横格记录中，从而组成一个新数据文件。

二是重构记录为变量。如果有几组有联系的数据记录，要求横格数据出现在纵格中，从而形成新的数据文件。

三是转置所有的数据。如果要转置所有的数据，即所有排变成列，或相反。这时可以关闭数据重构对话框，而打开转置对话框。

操作过程：

要用到数据重构的两个例子

先以简单数据结构为例：一个记录是一个观测量，一个变量占一纵格，一个记录占一横格。要测量一个班所有学生的考试分数，那么所有的成绩要求只能出现在一个纵格里，一格横格一个学生。

一个复杂数据的例子：要分析数据，就是根据某些条件分析变量是如何变化的。这些条件可以是具体的实验处理、人口统计、时间点或是其它。在分析时，这些条件看作是因素。在分析这些因素时，就有了一个复杂的数据结构。信息可处于几个纵栏中（一个栏算一个因素）；同理，信息可能处于多排中（一排算一个因素）。在这种情况下，就要用到“重构数据”，形成一个复杂的数据结构。

当下的数据文件和要形成一个什么样的数据结构，决定使用哪一项数据重构规则。

文件的数据是如何排列？可能是处于不同的变量中（几组记录中），也可能处在同一的变量中。

如：几组记录。变量和条件在不同纵格中，下表：

前两排是一组记录，因为数据有联系，有同一水平上的数据。在SPSS分析中因素就是分组变量。

几组纵栏：同一纵栏中有变量和条件。

上面两个纵栏是一个变量组，因为两组变量有联系。var＿1 代表因素水平 1；var 2＿代表因素水平 2。在SPSS数据分析中，如果数据结构是这样的话，因素常看作重复测量，新文件中需要什么样的数据结构取决于所使用的分析过程。

需要记录组的分析过程：数据是记录组结构，则要求分类变量。其分析过程有univariate，multivariate，and variance components with General Linear Model，Mixed Models，and OLAP Cubes，独立样本T检验，非参数检验。如果数据是变量组，则用“数据重构”，将变量组转换为记录组。

需要变量组的分析过程：数据是变量组结构，可做重复测量分析。分析过程还有：广义线性重复测量，依赖时间的协变量COX回归分析，配对样本T检验，相关样本非参数检验。如果数据结构是记录组，用“数据重构”，将记录组转换为变量组。

操作步骤：

调入数据，点击“RECONSTRUCTURE”（数据重构），出现对话框如下：

调入数据，从表中可以看出，这是变量组，如果要求记录组，将作如下数据重构。

操作 1