组(Group)和序列都是工作文件中存储数据的容器。序列存储单个变量的数值型观测值,而组可以存储多个变量的观测值,既可以存储数值型数据,也可以存储文本数据。对组的操作分为两类,一是批量处理多个序列,如一次性报告多个序列的描述性统计量、一次性绘制多个序列的图像;二是分析组包含的序列之间的关系。
本章的主要内容包括:
· 创建组。
· 组窗口的工具栏。
组是序列或文本序列的集合,组在工作文件中的图标是大写的字母G。
将序列组合在一起形成一个新的对象,这一过程就称为创建组。创建组的方法主要有两种:一是通过序列创建组,二是通过新建对象创建组。
在工作文件窗口中单击“Chinese”序列,按下Ctrl键的同时单击“Math”序列、单击“English”序列。按下Ctrl键的同时单击序列,是为了选择多个不相邻的对象。如果不按下Ctrl键,则只能选择一个对象。
选择了要纳入组中的序列后,右击,在弹出的快捷菜单中选择“Open/as Group”,如图7.1所示。注意:单击序列的顺序,就是组成员在组内从左到右的排列顺序。组中保存的数据可以视为矩阵,矩阵中的列是不能随意调换位置的,所以在创建组时要注意序列的排列顺序。
图7.1 快捷菜单
通过前述步骤创建的组会在一个新的窗口中打开,如图7.2所示。窗口的标题栏是“Group:UNTITILED”,表明这个窗口中的对象类型是组,该对象还未命名,单击“Name”按钮,可以对其命名。
图7.2 组窗口
依次单击图7.1中的“View/Group Members...”,打开图7.3右边的组成员视图窗口。选中某个序列,右击,可以删除或增加序列,或单击“Edit Members...”,在编辑框内输入成员名称。也可从工作文件窗口拖拽序列到组窗口。
图7.3 组成员
依次单击主菜单“Object/New object..”,选择对象类型为组,在打开的“Series List”对话框中,输入序列名称,序列之间用空格隔开,如图7.4所示。注意,在该对话框中也可以输入组的名称,或者序列的数学表达式。
图7.4 “Series List”对话框
组窗口的工具栏是一系列工具按钮,排列在组窗口标题栏的下方,如图7.5所示。工具栏中集合了13个工具,其中“Object”“Print”“Name”“Freeze”“Sort”“Edit+/-”“Title”“Smpl+/-”“Sample”这9个工具的功能与序列窗口上述工具的功能一样,此处不赘述。本节将介绍“View”“Proc”“Compare+/-”“Transpose+/-”这4个工具的使用方法。
图7.5 组窗口的工具栏
1)视图工具
单击组窗口工具栏中的“View”按钮,下拉菜单列示了组的视图工具(见图7.6),分为4栏,每一栏的主要功能如下。
图7.6 组的视图工具
(1)表单和图形
组成员(Group Members)工具在7.1节中已作介绍,在此不赘述。
单击“SpreadSheet”,组中的数据将以表单形式呈现,这也是Eviews默认的打开组后的呈现形式。
“Dated Data Table”适用于年度、半年度、季度和月度时间序列,以表格形式呈现各年各季度时间序列的观测值。
将图7.2中的组命名为“G1”,其中包括语文、数学和英语3个序列,用直方图展示这3科成绩的分布差异。
单击“Graph...”,打开“Graph Options”对话框,如图7.7所示。在“Graph type”选项组的“General”下拉列表中选择“Basic graph”,在“Specific”列表框中选择“Distribution”,在“Details”选项组的“Distribution”下拉列表中选择“Histogram”。注意,在“Multiple series”下拉列表中选择“Single graph”,意思是在同一个坐标下绘制3个序列的直方图,单击“OK”按钮,得到图7.8。
图7.7 对多序列绘制单个图形的设置
图7.8 3科成绩的直方图
如图7.8所示,从3科成绩的直方图,可以看出,数学成绩整体高于英语成绩,语文成绩整体在3科成绩中最低。把要对比的序列集合在一个组中,利用组的画图工具,可以很方便地对序列的分布进行比较;比起对3个序列绘制3幅直方图,将3个序列的直方图呈现在一张图形中,对比更加直接明了。
若要对比男生和女生的3科成绩的分布差异,性别是分组因子,如图7.9设置各选项,得到图7.10。
图7.9 绘制分组图形的设置
图7.10 分组直方图
组的图形工具很强大,在此仅举两例让读者领略对组作图与对单个序列作图的不同效果。关于图形工具的使用方法,详见第10章。
(2)描述统计、列联表和重复值
如图7.6所示,依次单击“View/Descriptive Stats”后会展开“Common Sample”和“Individual Samples”两个分支。若序列中存在缺失值,选择“Common Sample”,则所有序列的样本容量都相同,在任何一个序列上存在缺失值的个案都将被剔除;若选择“Individual Samples”,则各个序列的样本容量不同。
“N-Way Tabulation”对组中的序列做列联表,主要用于存储数值代码,也就是本质上是定性变量的序列。创建“G2”组,其中包括性别(Male)和班级(Class)两个序列,在“G2”窗口,依次单击“View/N-Way Tabulation”,如图7.11所示,窗口显示了样本中学生在性别和班级上的分布、两个变量的相关系数,以及独立性检验的结果。
图7.11 性别和班级的列联表
“Duplicate Observations”用于查看组中是否有观测值完全相同的个案,并将其罗列出来。打开“G1”组,在“G1”窗口中,依次单击“View/Duplicate Observations”,则“G1”窗口显示重复值报告,如图7.12所示。
图7.12 重复值报告
如图7.12所示,在210位同学中,4位同学3科成绩都相同,7对同学3科成绩两两相同,192位同学3科成绩互不相同。单击目录中的条目,右边窗口将显示哪几位同学的成绩相同,如图7.13所示。
图7.13 重复值列表
重复值查找工具能帮助研究者查看样本数据中是否有重复的个案,是在数据处理和数据清洗阶段经常使用的工具。
(3)分析序列之间的关系
视图工具列表的第三栏是分析序列之间关系的工具,包括协方差分析(Covariance Analysis...)、参数是否相等的检验(Tests of Equality...)、主成分分析(Principal Components...)。
(4)时间序列分析
视图工具列表的第四栏工具适用于时间序列,包括自相关检验(Correlogram...)、交叉相关检验(Cross Correlation...)、长期协方差分析(Long-run Covariance...)、单位根检验(Unit Root Test...)、协整检验(Cointegration Test)和格兰杰因果检验(Granger Causality)。
2)程序工具
单击组窗口工具栏中的“Proc”按钮,下拉菜单列示了程序工具,这里集成了新建方程(Make Equation...)、因子分析(Make Factor...)、联立方程组(Make System...)、向量自回归(Make Vector Autoregression...)、重复抽样(Resample...)、主成分分析(Make Principal Components)等工具,如图7.14所示。
图7.14 程序工具
3)比较工具
比较工具可以显示观测值完全一致的观测单元。若某个观测单元在所有序列上的观测值都相等,比较工具会在表单中将其突出显示。如果组中只有两个序列,比较工具还会计算出每个观测单元在这两个序列上的差距和百分比差距。
创建一个包含语文成绩和数学成绩的组,将其打开,单击“Compare+/-”按钮,进入比较模式,如图7.15所示。编号为92的同学的语文成绩和数学成绩相同,“Delta”一列显示每位同学语文成绩和数学成绩的差,“Delta%”一列显示百分比差距。再次单击“Compare+/-”按钮,窗口将切换为原始窗口。
图7.15 比较模式
4)转置工具
单击组窗口工具栏中的“Transpose+/-”按钮,组中的序列将发生转置,再次单击“Transpose+/-”按钮,组中的序列将还原。例如,“G1”组中是3列210行观测值,转置后,就变为210列3行观测值。
打开组以后,选中列标题,右击,弹出的快捷菜单中有控制显示格式(Display format...)、插入序列(Insert Series)、移除序列(Remove Series)、导出数据(Save table to disk)等工具,如图7.16所示。
图7.16 组窗口中的右键菜单
双击组窗口的底部,将打开设置实时统计量的窗口,勾选需要显示的统计量(不超过6项)然后单击“OK”按钮。如图7.17所示,单击列标题“CHINESE”,下方状态栏显示相应的实时统计量,报告了210位同学的语文成绩的均值、中位数和标准差。选中不同的区域,状态栏显示的统计量会随数据区域实时变化。
图7.17 组的实时统计量
· 如果要分析两个或多个序列之间的关系,可以将这些序列创建为一个组,在组窗口中能快速找到分析多维数据的工具。
· 组窗口的视图工具集成了对多个序列作图、报告描述性统计量、序列间关系的检验等功能。
· 组窗口的程序工具集成了对多个序列建立回归模型、联立方程组、降维分析等功能。