推算全国孕妇血清维生素A的总体分布情况,对卫生指导工作具有重要意义。在统计学里,为了应对非设计抽样的估计难题,事后分层常常是优先选择的方法。本报告中,研究者通过居住现状分层的方法,对全国孕妇血清维生素A水平分布进行估计。
本节研究的总体为全国所有孕妇,假设2018年孕产妇所生新生儿皆为单胎,且城镇农村孕产妇比例与总人口比例相等,则城镇和农村孕妇数量可以从以下两个公式推算得出:
同一位孕妇处于不同孕期时,其血清维生素A分布可能存在较大的差异(维生素在不同孕期时的分布见第二章第五节中国孕妇血清维生素A在不同机体特征下的分布),故本章将分别估计孕早期、孕中期和孕晚期孕妇的维生素A分布。
研究总体被划分为孕早期孕妇、孕中期孕妇和孕晚期孕妇三个子总体,表27为样本中各孕期孕妇的比例,数据显示,每年各孕期孕妇比例不尽相同,例如2018年处于孕中期孕妇比例明显高于往年。在推算过程中,需要对全国处于孕早、中、晚三期的孕妇数量进行估算。首先用2018年的新生儿数量来近似代表2018年孕妇数量(假设孕妇所怀皆为单胎),至于分别估计孕早、中、晚期的孕妇数量,则使用各孕期时长在整个孕期中的时间占比来分配,如下述公式所示。
各孕期孕妇总体的人口基数采用如下方式计算:
表27 2014—2018年就诊的各孕期人数
以孕早期孕妇的血清维生素分布估计为例介绍估计思路,孕中期和孕晚期孕妇同理。
(1)将LIS系统产科门诊中所有城镇孕妇有效样本近似看作全国城镇孕妇的随机样本。
(2)将LIS系统产科门诊中所有农村孕妇有效样本近似看作全国农村孕妇的随机样本。
(3)将全国孕妇总体看作两层,一层为城镇孕妇,一层为农村孕妇。
(4)2018年全国城镇人口占总人口的59.58%,假设城镇孕妇占全国孕妇的比例与城镇人口占总人口的比例相等。将城镇孕妇的总体层权设定为60%,相应的农村孕妇的总体层权设定为40%。
(5)利用分层随机抽样理论,将两个独立随机样本的分布及其分布特征按各层的总体层权进行加权计算获得总样本的分布及其分布特征。
按照居住现状分层将全国孕妇看作“城镇”与“农村”两个层。其中将样本中城镇孕妇数据视为全国城镇孕妇的简单随机抽样样本数据,由此计算城镇孕妇血清维生素A水平分布及其95%置信区间,若将相对误差设定为6%,置信度设定为95%,则样本量满足根据公式1(见36页)推算的最小样本量。如图8至图10所示为相对误差为6%时,各孕期孕妇血清维生素A的分布。
图8 孕早期城镇孕妇血清维生素A水平分布
图9 孕中期城镇孕妇血清维生素A水平分布
图10 孕晚期城镇孕妇血清维生素A水平分布
研究者将样本中农村孕妇数据视作全国“农村”的简单随机抽样数据,以此计算农村层血清维生素A水平的分布,进而估计全国“农村孕妇”血清维生素A水平的总体分布。由于样本量大于公式1(见36页)中根据相对误差(不高于6%)和置信度(不低于95%)所确定的最小样本量,估计的相对误差将可稳定控制在6%以内。图11至图13为全国农村孕妇血清维生素A水平分布及其95%置信区间。
将城镇的总体层权设定为60%,相应地农村的总体层权设定为40%,两者加权得到全国各孕期孕妇血清维生素A水平的分布及其95%置信区间,如图14至图16所示。
图11 孕早期农村孕妇血清维生素A水平分布
图12 孕中期农村孕妇血清维生素A水平分布
按照现行维生素A的划分标准,统计结果表明,全国孕妇中约有0.73%的孕早期孕妇血清维生素A水平<0.20mg/L。按照孕早期孕妇的人口基数,约33 851名孕早期孕妇血清维生素A水平<0.20mg/L,其95%置信区间为(31820,35882);全国孕妇中约有0.79%的孕中期孕妇维生素A<0.20mg/L,按照孕中期孕妇的人口基数,约44 610名孕中期孕妇血清维生素A水平<0.20mg/L,其95%置信区间为(41934,47287);全国孕妇中约有2.05%的孕晚期孕妇维生素A<0.20mg/L,按照孕晚期孕妇的人口基数,约101 559名孕晚期孕妇血清维生素A水平<0.20mg/L,其95%置信区间为(95465,107652)。
图13 孕晚期农村孕妇血清维生素A水平分布
图14 孕早期孕妇血清维生素A水平分布
图15 孕中期孕妇血清维生素A水平分布
图16 孕晚期孕妇血清维生素A水平分布