购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

七、总体分布估计方法

鉴于本课题采用的维生素A、维生素E检测数据为自费检测项目,课题组数据99%来自二级及二级以上医院,纳入人群可能偏向于经济条件较好的孕妇。84%的检测数据来自城镇孕妇的孕检报告,样本的城乡份额跟全国实际情况有很大的出入,对于城镇孕妇具有更强的代表性。不过,必须了解,中国的医院基本设在城镇,农村鲜少建有医院,换言之,医疗设施条件上城镇居民与农村居民不存在显著差异。不同的是孕妇的参研意愿。本报告将会分别推算全国孕妇血清维生素A、维生素E的分布和全国城镇孕妇血清维生素A、维生素E的分布。

1.推算全国孕妇血清维生素A、维生素E分布的思路

在推算全国孕妇血清维生素A、维生素E分布时,将采用真实的农村/城镇孕妇数量比对相应的层进行加权,即将样本视为事后分层抽样得到的。

(1)将LIS系统产科门诊中所有城镇孕妇有效样品近似看作全国城镇孕妇的随机样本。

(2)将LIS系统产科门诊中所有农村孕妇有效样品近似看作全国农村孕妇的随机样本。

(3)将全国孕妇总体看作两层,一层为城镇孕妇,一层为农村孕妇。

(4)2018年全国城镇人口占总人口的59.58%,假设城镇孕妇占全国孕妇的比例与城镇人口占总人口的比例相等。将城镇孕妇的总体层权设定为60%,相应的农村孕妇的总体层权设定为40%。

(5)利用分层随机抽样理论,将两个独立随机样本的分布及其分布特征按各层的总体层权进行加权计算获得总样本的分布及其分布特征。

由于孕妇在不同孕期的维生素A、维生素E水平差异较大(表1和表4),因此在推算全国孕妇血清维生素A、维生素E水平总体分布时,将分别推算孕早期、孕中期和孕晚期孕妇的维生素分布。

2.推算全国城镇孕妇血清维生素A、维生素E分布的思路

本报告除了推算全国孕妇血清维生素A、维生素E水平总体分布外,还另行推算了全国城镇孕妇血清维生素A、维生素E水平的总体分布。在推算全国城镇孕妇血清维生素分布时,我们通过数据分析发现,城镇孕妇中子痫前期孕妇和非子痫前期孕妇在维生素A、维生素E分布上也存在很大差别。众所周知,子痫前期是孕产妇死亡和围产儿死亡的主要原因之一。因此在推算时需要考察样本数据中子痫前期的患病率和实际患病率是否一致。目前,关于子痫前期患病率,世界各地报道差异较大。研究表明,在我国子痫前期患病率可能和地域有关,不同地区的患病率差异较大。由于课题组数据并未覆盖所有省份,因此患病率和实际患病率会有一定出入。查找近10年的调查资料,选取样本量大于5 000的在城市进行的调查,计算得到目前我国城镇孕妇子痫前期患病率约为3.2%。对于全国孕妇子痫前期患病率目前并没有比较准确的数据,因此在推算全国孕妇血清维生素分布时,并未考虑样本孕妇子痫前期患病率的问题。

由于数据并非依照事先的抽样设计方案进行抽样采集的,所以抽样模型属于事后指定比例分层随机抽样。在推算时,研究人员考虑将全国城镇孕妇分为两层,一层为子痫前期孕妇;一层为非子痫前期孕妇。分别推算两个子总体血清维生素A、维生素E的分布,然后再使用子痫前期患病率作为权重进行加权得到全国城镇孕妇的维生素A、维生素E的总体分布。

为了准确推断全国城镇孕妇血清维生素A、维生素E水平的总体分布,同样具体考虑:

(1)将LIS系统产科门诊中所有城镇中子痫前期的孕妇有效样本近似看作全国城镇子痫前期孕妇的随机样本。

(2)将LIS系统产科门诊中所有城镇非子痫前期孕妇有效样本近似看作全国城镇非子痫前期孕妇的随机样本。

(3)将全国城镇孕妇总体看作两层,一层为子痫前期孕妇,一层为非子痫前期孕妇。

(4)将子痫前期孕妇的总体层权设定为3.2%,相应的非子痫前期孕妇的总体层权设定为96.8%;其他产科疾病没有纳入考虑范围内。

(5)利用分层随机抽样理论,将两个独立随机样本的分布及其分布特征按各层的总体层权进行加权计算获得总样本的分布及其分布特征。

本报告的主要内容之一是估计全国城镇孕妇血清维生素水平的分布,为了评估其估计精度,对总体分布估计所需样本量的讨论是非常必要的。但关于总体分布估计的样本量确定目前的理论是不足的,它不同于总体比例估计与总体均值估计。本报告所采用的公式1来自中国人民大学统计学院杜子芳教授的研究成果。

鉴于分层抽样的设计效应小于1,根据简单随机抽样的总体分布估计样本量确定公式进行样本量确定,其结果具稳健性。

公式1

其中, r 0 代表各个直方的相对误差, p 1 代表众数组的概率, L 代表组数(根据现行标准类数定为5 1 ), =1.96 2 N 代表总体总数。本次总体总数为全国城镇孕妇数量,假设2018年孕产妇所生新生儿皆为单胎,且城镇农村孕产妇比例与总人口比例相等。则2018年全国城镇孕妇人口数为:

1.使用样本中维生素A数据进行聚类分析时,依据BIC最大准则确定最佳聚类个数也为5。

2.本报告样本量比较大,因此样本比例经过标准化后可视为服从正态分布。

参数确定参考了报告中图7的结果。以此计算,若相对误差 r 0 取3%时,样本量不低于89 215。计算表明,对样本量为190 688的非子痫前期孕早期孕妇总体而言,其血清维生素A水平分布的估计相对误差可达3%以下。

图7 孕早期非子痫前期孕妇血清维生素A水平分布的估计 /Kqju5w9Ry4NZwtYHG1/2bW7G3ESrxHoLPQGuUvLchCYRmlx31V2xvExN8rO17b5

点击中间区域
呼出菜单
上一章
目录
下一章
×