Stata统计分析与行业应用案例详解（第2版）最新章节_张甜著

1.4　分类变量和定序变量的基本操作

1.4.1　分类变量和定序变量概述

在很多情况下，我们会用到分类变量（虚拟变量）的概念，分类变量（虚拟变量）的用途是通过定义值的方式将观测样本进行分类。例如，根据数据某一变量特征的不同把观测样本分为3类，就需要建立3个分类变量A、B、C，如果观测样本属于A类，其对应的分类变量A的值就为1，对应的分类变量B和C的值就为0。定序变量的用途是根据数据的数值大小将数据分到几个确定的区间，其在广义上也是一种分类。下面我们就用实例的方式来讲解一下分类变量和定序变量的基本操作。

1.4.2　相关数据来源

【例1.3】某国际知名足球裁判自执法以来在各地区的执赛信息如表1.5所示。试使用Stata 14.0对数据进行以下操作：（1）试生成新的分类变量来描述比赛级别；（2）试生成新的定序变量对场数进行定序，分到3个标志区间。

表1.5　某国际知名足球裁判执赛情况

1.4.3　Stata分析过程

在用Stata进行分析之前，我们要把数据录入到Stata中。本例中有3个变量，分别是地点、场数以及比赛级别。我们把地点变量设定为place，把场数变量设定为number，把比赛级别变量设定为type，变量类型及长度采取系统默认方式，然后录入相关数据。相关操作我们在1.2节中已有详细讲述。录入完成后数据如图1.14所示。