估算教育收益率时需要考虑影响个人收入的各种因素,这些因素大致可以分为个人因素与职业因素两类。个人因素主要包括个人的受教育程度、工作经验、专业、家庭背景、性别、种族等,职业因素主要包括就业区域、工作类型、单位级别、单位规模、单位行业、工作岗位类型等。本书在明瑟方程的基础上分别建立分阶段教育收益率、工程教育收益率估算模型来对我国的工程教育收益水平进行研究。
建立模型前首先做出研究假设如下:
——我国小学、初中、高中各教育阶段的规定教育年限分别为6年、3年、3年;
——在同一受教育阶段内每一年的教育收益率均相同;
——我国的退休年龄统一为60岁。
运用明瑟方程对我国的平均教育收益率进行初步估算。明瑟方程假定个人收入只受到受教育年限与工作经验的影响,将个人收入、学校教育年限和劳动力市场经历置入一个半对数形式的明瑟人力资本函数中来估算学校教育年限系数的取值,即明瑟收益率。
ln Y = a + bS + cE + dE 2 (3-1)
式3-1所描述的模型1.1中 Y 代表个人收入, S 代表学校教育年限, E 代表工作年限, E 2 为工作年限平方, b 为明瑟收益率,代表受教育程度每提高一年受教育者所获得的个人收入提高的比例。由于个人收入一般随受教育年限的增加而提高,随工作年限的增加而先增后减(年龄—收入曲线为上凸形状),因此通常情况下系数 b 、 c 、 d 的取值分别为正值、正值与负值。
现实中的教育收益除受学历与工作年限影响外还受到许多其他因素的影响,其中最主要的为职业因素。将职业因素作为控制变量引入教育收益率估算模型能使我们得到更为精确的教育收益率估算结果。因此将职业因素变量引入模型1.1得到扩展后的平均教育收益率估算模型1.2:
其中 D ij ( i =1,…, n )为n个职业因素控制变量,控制变量的系数在一定程度上能反映出控制组与参照组之间的区别。通过将引入职业因素变量前后两个估算模型对数据拟合度(调整的R 2 )的差异也可以看出各职业因素变量对教育收益的影响程度。
在CGSS数据中采用的职业因素控制变量的个数为7个,分别是目前工作类型( D 1 ,全日工作、非全日工作、临时性工作、务农、无工作),政治面貌( D 2 ,共产党员、非共产党员),单位所有制性质( D 3 ,国有、集体所有、私有/民营、三资企业、其他/无工作/务农),主管部门级别[ D 4 ,中央、省级、地市级、区县级、街/镇/乡、居委/村委、无单位(自雇等)/其他/务农/无工作],技术职称[ D 5 ,无职称、初级、中级、高级、无单位(自雇等)/其他/务农/无工作],单位内管理级别[ D 6 ,不从事管理工作、一般管理人员、中层管理人员、高层管理人员、无单位(自雇等)/其他/务农/无工作],国家行政级别[ D 7 ,无行政级别、副科级以下、副科级、科级、副处级、处级、副司局级、司局级及以上、无单位(自雇等)/其他/务农/无工作]。D ij 即为D i 的取值, m 为D i 可能的取值种类个数。为了“避免控制变量陷阱”的出现,需要在D i 各取值中选出1个作为参照组,所以 j 的取值范围为1-( m -1)。
模型1.1与模型1.2只提供了平均教育收益率的估算方法,对特定教育阶段收益率的估算还需要通过替换一系列含不同教育阶段的虚拟变量的方式来进行。用 S k ( k =1,…,4)分别代表最高受教育程度为小学、初中、高中、大学的样本的平均受教育总年限, b k ( k =1,…,4)为 S k 的系数。其中 S k ( k =1,…,4)均为哑变量,当该教育阶段出现时,将其取值直接确定为该受教育程度样本的平均受教育总年限,否则将其赋值为“0”。
用 λ k ( k =1,…,4)分别代表我国各教育阶段的规定教育年限, θ k ( k =1,…,4)分别代表最高受教育程度为小学、初中、高中 、大学 的样本在各相应最高受教育阶段的平均受教育年限。小学阶段的教育收益率 β 1 即为 b 1 ,初中、高中、大学阶段的教育收益率则需要通过下述公式进一步计算:
计算得出的 β 2 、 β 3 、 β 4 值即分别为初中、高中、大学阶段的教育收益率。
在模型2.1中引入职业因素控制变量得到扩展后的分阶段收益率估算模型2.2:
其中 D ij ( i =1,…, n )依然为n个职业因素控制变量的取值,其他变量所代表的含义及初中、高中、大学阶段收益率的进一步计算方法均同模型2.1。