1 假设你需要进行一项研究,以确定较小的班级规模是否会提高四年级学生的表现。
(i)如果你可以进行你想做的任何实验,你会做些什么?请具体说明。
(ii)更符合实际地,假设你可以搜集到某州几千名四年级学生的观测数据。你可以得到每个学生在四年级时所属班级的规模以及他四年级期末的标准化考试分数。为什么你会预计班级规模与考试成绩呈负相关关系?
(iii)负相关关系一定意味着更小的班级规模会导致更好的表现吗?请解释。
答: (i)假定能够随机的分配学生们去不同规模的班级,也就是说,在不考虑学生诸如能力和家庭背景等特征的前提下,每个学生被随机的分配到不同的班级。因此可以通过比较和检验不同班级规模下学生的成绩来看班级规模(在伦理考量和资源约束条件下的主体)对学生的成绩是否有显著的差异。
(ii)负相关关系意味着更大的班级规模与更差的考试成绩是有直接联系的,即班级规模越大,学生考试成绩越差。
通过数据可知,两者之间的负相关关系还有其他的原因。例如,富裕家庭的孩子在学校可能更多地加入小班,而且他们的成绩优于平均水平。
另外一个可能性是:学校的原则是将成绩较好的学生分配到小班。或者部分父母可能坚持让自己的孩子进入更小的班级,而同样这些父母也更多地参与子女的教育。
(iii)鉴于潜在的其他混杂因素(如ii所列举),负相关关系并不一定意味着更小的班级规模会导致更好的表现。控制混杂因素的方法是必要的,而这正是多元回归分析的主题。
2 工作培训项目的意义之一在于它可以提高工人的生产力。假设你需要评估更多的工作培训是否可以使工人具有更高的生产力。不过,你没有工人的个人数据,但可以获得俄亥俄州制造企业的数据。具体来说,对每个企业,你都有人均工作培训小时数(training)和单位工时生产的合格产品数(output)的相关信息。
(i)请仔细陈述这个政策问题背后其他条件不变的试验思想。
(ii)一个企业培训其员工的决策是否很可能独立于工人的特征?工人可观测与不可观测的特征各有哪些?
(iii)除工人特征之外,再列出一个影响工人生产力的因素。
(iv)如果你发现training和output之间成正相关,你是否已经足够令人信服地证明了工作培训可以提高工人的生产力?请解释。
答: (i)其他条件不变的试验思想在本题可以假设两个厂商A、B,厂商A除了对每个工人提供比厂商B更多的职业培训外,其他条件与厂商B都是相同的,由此可以得出厂商A的产出与厂商B的产出的不同是由于培训小时数不同所导致的。
(ii)一个企业培训其员工的决策依赖于工人的特征。
可观测的特征包括:工作年限、学历、专业工作经验,甚至包括年龄、性别和种族。
不可观测的特征包括:企业可能根据能力高低来为员工提供培训,但是“能力”是难以量化的,经理只能根据不同员工能力相关的方面来做出判断。另外,不同类型的员工可能被更高的平均培训时间所吸引,这对雇主而言是不明显的。
(iii)工人可获得的资本和技术的数量也影响产出。如果两个企业采用不同的资本或技术,即使他们拥有相同类型的员工,他们的产出也将会不同。经理的管理质量同样也是影响产出的因素之一。
(iv)并没有,除非培训量是随机分配的,不然即使培训不能促进工人的生产率提高,(ii)和(iii)中所列的因素也可能导致培训和产出之间呈现正相关关系。
3 假设你所在的大学需要你找出每周学习小时数(study)和每周工作小时数(work)之间的关系。将这个问题刻画为“推断study是否‘导致’work或work是否‘导致’study”的问题是否合理?请解释。
答: 不合理。因为找出每周学习小时数(study)和每周工作小时数(work)之间的关系,是说每周学习小时数(study)和每周工作小时数(work)之间有关系,但没有说是因果关系,每周学习小时数可能与其他因素有关或每周工作小时数与其他因素有关。
4 拥有税收控制权的州或省份有时候会减少税收以刺激经济增长。假设你受雇于某州政府,你需要估计公司税率对人均地区生产总值增长的影响。
(i)你需要怎样的数据以进行统计分析?
(ii)对照试验是否可行?你需要什么?
(iii)州生产总值增长和税率之间的相关性分析是否可信?请解释。
答: (i)估计公司税率对人均地区生产总值增长的影响,应该获取公司税率和各省的生产总值。
(ii)对照试验是可行的。此时需要收集投资、消费和净出口等变量,作为控制组的控制变量。
(iii)相关性分析不可信。税率的增长对于生产总值有明显的抑制作用,即使控制了模型中的其他变量,如消费支出、货币的供应量等。
C1.回答本题需使用WAGE1中的数据。
(i)求出样本的平均受教育程度。最低和最高受教育年数分别是多少?
(ii)求出样本中的平均小时工资。它看起来是高还是低?
(iii)工资数据是以1976年美元度量的。利用互联网或纸质资料,查找1976年和2003年的消费者价格指数(CPI)。
(iv)利用第(iii)部分中的CPI值,求以2013年美元度量的平均小时工资。现在,平均小时工资看起来合理了吗?
(v)样本中有多少女性和男性?
答: (i)样本的平均受教育程度为12.6年。最低受教育年数为0,最高受教育年限为18年。
(ii)平均小时工资是5.90美元,它看起来较低。
(iii)1976年的CPI为56.9,而2013年的CPI为233。
(iv)将1976年美元转换成2013年美元,应该使用CPI的比率,即233/56.9≈4.09。因此,以2013年美元度量的平均小时工资为:5.9×4.09≈24.13(美元)。这是比较合理的工资水平。
(v)样本中有252位女性,274位男性。
C2.回答本题需使用BWGHT中的数据。
(i)样本中有多少女性?其中有多少女性在怀孕期间抽烟?
(ii)平均每天抽烟的数量是多少?平均值是不是度量这个案例中“典型”女性的好指标?请解释。
(iii)怀孕期间抽烟的女性平均每天抽烟数量是多少?这与第(ii)部分中的答案有何区别?为什么?
(iv)求出样本中fatheduc的平均值。为何计算这个平均值时只用了1192个观测值?
(v)报告家庭收入的平均值和标准差,以美元为单位。
答: (i)样本中有1388位女性。有212位女性报告在怀孕期间抽烟。
(ii)平均每天抽烟的数量为2.09。但是样本包含了1176位不吸烟的女性。报告只是掩盖了85%的女性不吸烟的事实。在怀孕期间不吸烟的女性作为“典型”女性的度量指标将更有意义,此时吸烟的平均数量为0。
(iii)怀孕期间抽烟的女性中,平均每天抽烟数量为13.7,这高于将所有的女性作为样本总值得出的平均值。因为第(ii)部分的样本中包括1176个不抽烟的样本。
(iv)fatheduc的平均值为13.2。因为有196个fatheduc的观测数据丢失了,因此这些数据在计算平均值时是必须排除的。
(v)平均家庭收入为29027美元,方差为18739美元。
C3.MEAP01中的数据是密歇根州2001年的数据。利用这些数据回答如下问题:
(i)求出math4的最大值和最小值。这个范围合理吗?请解释。
(ii)有多少学校在数学测试中有100%的通过率?占整个样本的百分比是多少?
(iii)有多少学校的数学测试通过率刚好为50%?
(iv)比较数学测试和阅读测试的平均通过率。哪个测试更难通过?
(v)求出math4和read4之间的相关系数。你可以得出什么结论?
(vi)变量exppp是某学校每个学生的平均支出。求出exppp的平均值和标准差。你认为每个学生的平均支出存在大幅波动吗?
(vii)假设学校A平均每个学生支出6000美元,学校B平均每个学生支出5500美元。学校A的支出超过学校B的支出百分之多少?与根据自然对数之差近似的百分比差异100×[ln(6000)-ln(5500)]进行比较。(参见书末附录数学复习A中的A.4节。)
答: (i)math4的最大值为100,最小值为0。
(ii)有289个学校在数学测试中有100%的通过率,所占比为:289/1823≈15.85%。
(iii)有17个学校在数学测试中有50%的通过率。
(iv)math4的平均通过率是71.9%,read4的通过率是60.1%。至少在2001年,read4更难通过。
(v)math4和read4之间的相关系数为0.843,说明两者之间具有高度线性相关关系。也就是说,一所在一门课程中具有很高通过率的学校在其他课程上具有很高通过率的趋势是很强的。
(vi)变量exppp的平均值是5194.87美元。标准差是1091.89美元,这表示学生均教育支出是存在较大的差别的。(平均教育支出的最小值为1206.88美元,最大值为11957.64美元)
(vii)学校A超出学校B的支出百分比是:(6000-5500)/5500≈9.1%,[ln(6000)-ln(5500)]≈8.7%。
C4.JTRAIN2中的数据来自1976~1977年间对低收入男性进行的一项工作培训试验;参见Lalonde(1986)。
(i)利用指标变量train确定接受工作培训的男性比例。
(ii)变量re78是1978年的收入,以1982年的千美元度量。对接受工作培训的男性样本和未接受工作培训的男性样本,分别计算re78的平均值。二者的差别在经济意义上大吗?
(iii)变量unem78是表示一个男性在1978年是否失业的指标变量。接受工作培训的男性的失业比例是多少?没有接受工作培训的男性的失业比例是多少?请对二者之间的差异做出评价。
(iv)根据第(ii)和第(iii)部分,工作培训项目有效吗?如何使我们的结论更有说服力?
答: (i)接受工作培训的男性比例为:185/445≈41.6%。
(ii)针对接受工作培训的男性样本,re78的平均值为6350美元;针对未接受工作培训的男性样本,re78的平均值为4550美元。两者之间的差异为1800美元,这是非常大的差异。平均而言,接受工作培训的男性的收入比未接受工作培训的男性多大约40%。
(iii)接受工作培训的男性在1978年的失业比例为24.3%;未得到工作培训的男性在1978年的失业比例为35.4%,两者之间的差距仍然很大。
(iv)从失业率和收入的差距可以看出,工作培训项目看来有效。为了使结论更具有说服力,应该建立统计意义上的显著模型。
C5.FERTIL2中的数据收集自1988年居住在博茨瓦纳共和国的女性。变量children表示现有孩子的数量。变量electric是一个二元指示变量,1表示该女性家里有电,0表示没有电。
(i)样本中children的最大值和最小值分别是多少?children的平均值是多少?
(ii)家里有电的女性占多大百分比?
(iii)分别计算出家里没电和家里有电的女性children的平均值。请对所得结果做出评价。
(iv)根据第(iii)部分,可以推断出有电“会导致”女性有更少的孩子的结论吗?请解释。
答: (i)样本中children的最大值为13,最小值为0,平均值为2.27。
(ii)4358个女性样本中,仅有611位家里有电,占14.02%。
(iii)家里没电的女性children的平均值为2.33,家里有电的女性children的平均值是1.90。所以家里有电children平均值比家里没电的低0.43。
(iv)不能推测这种因果关系。因为还存在其他的因素可能也会影响孩子的数量和家里是否有电,如家庭收入和受教育水平。
C6.利用COUNTYMURDERS中的数据回答本题。只需使用1996年的数据。变量murders指该城镇报道的谋杀案的数量。变量execs指某一城镇中对被判死刑的罪犯执行的处决数量。美国的大部分州有死刑,但有些州没有。
(i)数据集中包含多少城镇?这些城镇中有多少在1996年没有发生过谋杀案?有多少百分比的城镇在1996年没有死刑?
(ii)谋杀案的最大值是多少?判处死刑的最大值是多少?为什么判处死刑的平均数这么小?
(iii)计算murders和execs的相关系数并描述你得到的结果。
(iv)在第(iii)部分你已经计算出一个正相关关系。你是否认为更多的死刑数量会导致更多的谋杀案?什么原因可能解释这一正相关关系?
答: (i)数据集中有2197个城镇,其中1051个城镇在1996年没有发生过谋杀案,98.6%的城镇在1996年没有死刑。
(ii)谋杀案的最大值是1403,判处死刑的最大值是3。判处死刑的平均数为0.0159,因为大多数城镇判处死刑为0。
(iii)murders和execs的相关系数为0.21,两者之间存在较弱的正相关性。
(iv)不能。在给定的城镇中,仅有21%的谋杀案被判处了死刑。
C7.ALCOHOL中的数据集包含美国一些男性样本的信息。两个关键变量是自己报告的就业情况和酒精滥用情况(还有很多其他变量)。变量employ和abuse都是二元指示变量:它们只能取值0和1。
(i)样本中报告酗酒的男性占多大百分比?样本中男性的就业率是多少?
(ii)酗酒的男性群体的就业率是多少?
(iii)不酗酒的男性群体的就业率是多少?
(iv)比较你在第(ii)和第(iii)部分得到的答案的差异。这能否让你推断出酗酒导致了失业?
答: (i)酗酒男性的比例为9.9%。样本中男性的就业率为24.3%。
(ii)酗酒的男性群体的就业率是22.6%。
(iii)不酗酒的男性群体的就业率为24.5%。
(iv)不能。因为酗酒和不酗酒的男性群体的就业率分别是22.6%和24.5%,差别很小,这意味着酗酒不会造成失业。
C8.ECONMATH中的数据集来自某大学一门大型微观经济学导论课程的学生。对于这个问题,我们感兴趣的是两个变量:score和econhs。score是学生课程的期末成绩;econhs是一个二元变量,表示一个学生在高中是否参加过经济学课程。
(i)样本中有多少学生?有多少学生在高中参加过经济学课程?
(ii)对于那些在高中参加过经济学课程的学生,他们期末的平均成绩是多少?与那些在高中没有参加过经济学课程的学生相比怎样?
(iii)在第(ii)部分的发现足够说明在高中参加经济学课程与在大学的课程表现的因果关系吗?
(iv)如果你想利用平均值的差异对在高中参加过经济学课程的效果进行一个好的因果关系估计,你会做什么实验?
答: (i)样本中有856个学生,有317个学生在高中参加过经济学课程。
(ii)对于那些在高中参加过经济学课程的学生,他们期末的平均成绩是72.08。那些在高中没有参加过经济学课程的学生,他们期末的平均成绩是72.91。
(iii)通过比较平均成绩,不能足够说明在高中参加经济学课程与在大学的课程表现的因果关系。影响学生经济学课程成绩的因素有很多,其中一些因素可能与他们是否在高中学习经济学(随后选择在大学学习经济学)有关。如果不对这些因素进行控制,就不能足够说明在高中参加经济学课程与在大学的课程表现的因果关系。虽然这两个变量之间有一个很小的(负)相关性,但是仅仅比较这两组学生的表现几乎没有因果关系的证据。
(iv)选择除了是否在高中参加过经济学课程之外在各个方面尽可能相似的学生,将学生设置为两组,分别是对照组:在高中没有参加过经济学课程和实验组:在高中参加过经济学课程。