实用临床流行病学研究设计最新章节_游顶云著

第二节
研究设计

一、研究对象

研究人员根据研究目的确定目标人群，然后进一步明确来源人群（如某地的目标人群），依据诊断标准、纳入标准、排除标准确定合格人群，最后确定研究对象。如果目标人群人数较少，可将其全部作为来源人群，即普查。如果来源人群很大，则需要从中抽出有代表性的样本。

（一）普查

指在特定时间对特定范围内的人群中的所有人进行调查。普查的主要目的是对疾病早发现、早诊断和早治疗；了解疾病的分布情况；建立某些生理、生化等指标的正常值。普查适用于病程长、患病率高或检查方法简单的疾病调查。

（二）抽样调查

是调查某一人群（总体）中具有代表性的部分人群（样本），用样本结果估计总体中患病率或某些特征的情况。抽样调查便于节约调查资源（人力、物力、财力），缩短调查时间，控制调查质量。抽样方法包括非概率抽样和概率抽样。概率抽样也称随机抽样，是通过抽样方法从来源人群中抽取抽样单位，使得每个单位被抽中的概率是固定的、已知的或相等的。在非概率抽样中，样本单位被抽中的概率是不确定的或未知的。非概率抽样所得到的样本也被称为“随意抓取的样本（grab sample）”。

例1-1　Lars Bo Andersen、MaarikeHarro等学者开展了一项有关儿童运动和心血管疾病风险的横断面研究。他们的目标人群是9岁和15岁的儿童。目标人群是来自爱沙尼亚、丹麦和葡萄牙的这两个年龄的儿童。因为研究人员不可能调查这3个国家中9岁和15岁的所有儿童，所以他们对目标人群中的一个随机样本进行研究。

1.非概率抽样

非概率抽样主要是指方便抽样，即对某个时段内在某地碰到的人（如街头行人、门诊就诊者、在义务体检点接受血压测量的人）依次进行调查，由研究人员根据经验判断样本是否具有代表性。虽然这种抽样方法容易实施，但是可能会无意间造成选择偏倚，即纳入研究的对象和未纳入的对象因研究人员的主观纳入标准导致一些特征或因素方面存在差异。由于研究人员很难明确偏倚的类型和程度，因此基于非概率抽样的研究结果不宜外推到范围更广的人群。

例1-2　在一项肺癌诊断标志物（呼气中的挥发性有机化合物）的研究中，Michael Phillips、Kevin Gleeson等人对两所医院接受支气管镜检查的108名患者采集呼气样本进行检测。该研究的目标人群为因局部胸片异常而接受支气管镜检查的患者。来源人群为位于美国和英国两所医院的这类患者。研究人员采用方便抽样选择研究对象，即把1995年8月—1996年10月期间在两所医院接受支气管镜检查的患者均列为潜在的研究对象，然后把符合研究标准且自愿签署知情同意书的对象确定为研究样本。

例1-3　在一项探索中国人吸烟和膝关节炎关系的横断面研究中，研究人员根据要求于2013年10月—2014年5月对中南大学湘雅医院体检中心的体检对象进行筛选，其中有7 343人接受了包括负重的双侧膝关节X线片在内的体检服务。一些体检对象因为符合排除标准而未被纳入研究。剩下的对象中还有2 584人未报告他们的健康习惯（包括吸烟）相关信息。最终的研究对象为3 789人。虽然这个研究的样本量较大，但是抽样方法为方便抽样（样本仅来自一个医院的体检人群），且仅从一个时长为8个月的时段抽出样本，所以把研究结果推及“中国人群”需要谨慎。

2.概率抽样

在进行概率抽样前，研究人员需要知道或估计样本单位被抽中的概率，因此这类抽样方法可以减少或消除选择偏倚。通过抽样框架可以从目标人群中抽取随机样本。通常，抽样框架要计数和登记所有的抽样单位。抽样单位可以是个人、住户或医院等。虽然官方的信息管理系统可为抽样框架提供数据，但是这些数据不一定完整和正确，可能在一定程度上影响抽样框架的质量。常用的概率抽样方法包括：简单随机抽样、系统抽样、多阶段抽样和分层随机抽样（整群抽样）。

（1）简单随机抽样：

简单随机抽样是最基本的随机抽样方法，使用这种方法可以使每个抽样单位被抽中的概率相等。

简单随机抽样的步骤包括：第一，确定抽样单位。根据研究对象的特征，清晰界定抽样单位。第二，明确抽样框架，列出所有抽样单位。抽样单位应尽量保证全面、完整，符合研究时限，避免出现选择偏倚。通常可以从普查名单或电子登记系统中获得抽样单位。抽样框架确定后，应该对其中的抽样单位进行编号。第三，通过统计公式或软件计算样本量。第四，通过随机数从抽样框架中抽出随机样本。随机数可以通过随机数表、计算器、Excel软件或统计软件生成。该抽样方法较少单独使用，特别是当研究样本量较大时。

简单随机抽样的优点是操作简便，缺点是仅适用于相对集中的小规模人群，并要求抽样框架完整，且抽样误差大。

例1-4　为了解子宫内膜癌存活者的运动和肥胖情况及其与身体功能、疲劳和疼痛的关系，美国的研究人员对某癌症中心的该病患者进行横断面研究。研究的目标人群是早期子宫内膜癌患者。符合研究标准的259名登记在册的患者构成了目标人群。研究人员采用简单随机抽样的方法从来源人群中抽取200名患者作为研究样本。其中有3名患者的住址不详，研究人员又从之前未抽中的住址详细的患者中随机抽出3人，以保证样本量为200人。之后，研究人员向研究对象邮寄了调查材料（包括解释研究的信函、调查问卷、拒绝参加研究的表格和邮资已付的回信信封）。在调查材料寄出1周后，研究人员又寄了一封感谢信（并提醒研究对象对之前的调查材料做出回应）。在调查材料寄出3周和6周后，研究人员对未回信的研究对象又分别寄送了调查材料。最后，121名研究对象寄回了填好的材料，其中1人的问卷被判为无效，问卷有效率为61%。

（2）系统抽样：

有时系统抽样比简单随机抽样更方便操作。系统抽样是根据系统性的原则进行抽样，如抽取具有相同起始字母名字的人、在特定日期出生的人，或者住在某个区域的人。系统抽样的步骤包括：第一，抽样单位需要以某种规则顺序进行排列，如某条街道上住宅的门牌号、患者的门诊号等。第二，根据样本量确定研究对象占来源人群的比例，例如从200人中抽出40人，比例为1∶5。换言之，来源人群被分为40等分，每个等分包含5人，从每个等分中等间隔随机抽出1人即可组成样本。第三，确定抽样起始点和抽样间隔进行抽样。如前例，每个等分包含5人，从1～5的5个整数中随机抽出一个整数作为抽样起始点，然后每隔5个数从下一个等分中抽出对应的整数。例如，抽样起点为2，间隔5抽到的数依次为7、12、17……

系统抽样的优点是方便，且不需要生成随机数字。缺点是抽样误差接近于简单随机抽样，如果对抽样框架进行间隔抽样，使得样本的某些特征突显，则可能存在偏倚。例如，按门牌号对住宅进行系统抽样，门牌号很小或很大的住宅可能位于街道的两端，它们和位于街道中段的住宅可能存在差异。再如，英语名字中以A和S开始的名字比以Q和X开头的名字要普遍得多，具有普通名字的人和具有生僻名字的人在一些因素或特征上不一定很相似。

例1-5　一项横断面研究旨在了解在阿联酋生活的外国人的2型糖尿病患病情况，研究人员把到检疫部门体检办理健康证明的外国人作为目标人群。他们采取4个步骤进行抽样。第一，根据公式（假设外国人糖尿病的患病率为20%，调查的无应答率为20%）计算出最小样本量（2000）。第二，利用检疫部门的信息登记系统，抽取2011—2012年的登记信息。第三，根据研究对象的纳入标准确定抽样框架。第四，通过系统抽样的方法（按登记的时间顺序，每10人中抽出1人），从抽样框架中抽出随机样本。最后，研究人员抽取了3 000多份血样，其中2 719名被抽中血样的外国人还配合研究人员进行了其他数据的收集（如问卷调查、身体指标测量、血压测量等）。

（3）多阶段抽样：

在不能获得抽样框架、抽样成本很高或来源人群非常分散的时候，可以采用多阶段抽样。多阶段抽样是一个至少包括两个阶段的抽样过程，先抽取地区或机构（如工作单位、学校、医院），再通过随机抽样方法从地区或机构中抽取样本。

以两阶段抽样为例说明多阶段抽样的步骤。第一，按照地区、村庄等对来源人群进行分类，并把地区、村庄等作为第一阶段抽样单位（或初始抽样单位）。第二，从第一阶段抽样单位中随机抽出样本。第三，第一阶段抽样单位中的随机样本包含第二阶段抽样框架（住户或个人），从中随机抽出样本。

在多阶段抽样中，研究人员可以采用一些方法保证样本的代表性。可以先选出一户作为起点，然后按照一定规则抽出其他户。还有一种做法是，把某地的人口密集区（如市场或广场）作为中心点，在中心点随机选定一个方向（如通过扔起铅笔，看它落地后的指向），从中心点沿选定方向所包含的住户均作为抽样单位，从抽样单位中随机选出一定数量的住户作为样本。多阶段抽样不必过分注重精确性，只要能保证样本的多样性和代表性即可。如果研究的目的是大致估计居住分散的目标人群的患病率或某特征的分布，可以采用多阶段抽样从各个地区中按照人口比例抽取样本。

多阶段抽样的优点是成本低、耗时少。缺点是在第一阶段抽样中同类的人群（如居住地相同）具有一定同质性（如具有相似的生活方式），但是其特征可能与总人群不同。此外，对多阶段抽样的数据分析比其他抽样数据要复杂一些。

例1-6　上述（例1-1）3国儿童的研究采用两阶段整群抽样随机抽取符合年龄要求的儿童。初始抽样单位是学校，第二抽样单位是注册入学的学生。爱沙尼亚、丹麦和葡萄牙被抽中的研究对象的研究参与率分别为76%、75%和73%，最终有1 725个女孩和1 592个男孩参加研究。

（4）分层随机抽样：

在分层随机抽样中，研究人员根据一些重要特征（如性别、年龄、社会经济状况等）把来源人群分为几个亚人群（也被称为层），然后从每个亚人群中随机抽出一定数量的人组成样本。如果各亚人群中样本所占的比例与整体人群中各亚人群所占的比例较为接近，则说明样本的代表性较好。

在很多情况下，分层随机抽样是最合适的抽样方法。例如，有时我们希望了解各层特征或结局的分布情况，因此各层的样本量需要达到一定要求。如果各层的患病率可能有差异，那么也需要采用这种抽样方法。如果抽样框架只能在某些亚人群中获得，这种抽样方法也较为合适。

例1-7　在一项欧洲人群脊椎骨质疏松的研究中，研究人员为了评估脊椎变形的患病率，采用分层随机抽样获得研究样本。首先，抽取欧洲19个国家的36个医疗中心参与研究（第一阶段样本）。然后，每个中心根据现有数据的主要来源（人口普查名单、选民登记或健康登记）从一般人群的抽样框架中抽取600人的随机样本（第二阶段样本）。最后，研究人员对第二阶段样本进行年龄分层（50～54岁、55～59岁、60～64岁、65～69岁、70～74岁、75岁以上），并从每个年龄层中随机抽出一定数量的患者组成研究样本（第三阶段样本）。研究对象配合研究人员完成有关生活方式的问卷调查，并拍摄外侧胸腰椎的X线片。

二、抽样设计

研究人员在进行抽样设计时，应该综合考虑多种因素，如研究目的、适合抽样框架的研究样本可获得性、来源人群的大小和地理分布、可利用的资源等。

抽样调查需要考虑抽样方式，如果研究目的是评估目标人群的患病率，那么在抽样的各个阶段都要做到随机抽样。如果研究是为了探索暴露与结局的可能关系，则可以不进行随机抽样。在这种情况下，信息的数量和多样性比样本的代表性更重要。受到伦理和成本因素的影响，严格意义上的随机样本通常很难获得。例如，如果需要对研究对象进行侵入性诊断，样本只能来自医院的就诊患者，这类样本的研究结果往往不能推及到一般人群。

三、样本量的估算

抽样设计还需要考虑样本量大小。确定样本量的基本原则是，所需样本量首先应该能够回答研究问题，在满足这一条件的基础上应该尽量降低研究的人力、物力、资金和时间等成本。

四、数据收集

横断面研究中最常见的数据收集方法是问卷调查，据不同情况伴有体检、诊断性检测和生物学标本采集。问卷调查可以面对面进行，也可以通过电话或邮件等方式进行。

例1-8　欧洲3国的研究测量了研究对象（儿童）的血压、腰围、体重、身高和皮褶厚度。经过统一培训的研究人员使用Tanner分类标准测量了儿童的发育情况。此外，研究人员还按照规程采集和分析了儿童的血样。为了评估儿童的运动水平，研究人员使用加速传感器测量身体活动的垂直加速度。

设计和填写问卷都并非易事，特别需要注意3点：①要让问卷中的问题通俗易懂，尽量使用简单明了的词汇和句型。②要考虑设计的问题是否需要调查对象回忆作答。可以把问题具体化，让调查对象容易回忆。在解释数据时，要考虑回忆偏倚对数据有效性的影响。③问卷中的问题尽量不要让研究对象产生胁迫感或不适感。当被问及一些问题时，研究对象可能为了不被评判，而只给出符合社会道德的答案。即使研究人员知道研究对象主观有意“挑好的说”，他们也很难明确这类偏倚对研究结果的影响程度。

在正式开展问卷调查之前，研究人员应该先进行预试验，确保研究对象理解并接受问卷中的问题。从研究对象中选择一些人开展预试验，让他们反馈对于问卷的感受和意见，例如用语是否恰当、问题能否理解、答题是否有不适感、问卷是否过长、问题是否难以回答等。预试验还可以评估问卷的稳定性（可靠性）和准确性（有效性）。可靠性反映了问卷收集的数据能否在不同的调查中重复出来，有效性则反映了问卷收集的数据能否反映真实情况。

研究人员根据预试验的结果对问卷进行修改完善后，即使用问卷对目标人群进行正式调查。调查对象、调查人员以及两者间的互动都可能影响调查结果。要收集可靠的信息、培训调查人员，经过统一培训，调查人员需要熟悉研究问卷，并需要用统一的方式提问，进行提示，与调查对象交流。

研究收集的数据取决于研究目的。一些研究主要为了解疾病在人群中的分布情况，因此主要收集其患病的相关信息。如果研究人员需了解与患病有关的原因，还需收集暴露相关的数据，这样有助于他们进一步探索暴露和结局的关系，为后续的深入研究提出病因假设。

不是所有随机样本中的对象都会参与研究，一些人会拒绝进入研究，另一些人在研究过程中可能外出或死亡。这些情况均会造成研究对象的选择偏倚。研究人员应该设法提高研究样本的参与率和应答率。收集未应答对象的一些基本信息，有助于了解这些对象与应答对象是否有差异，以及这种差异是否会导致研究偏倚，并有助于评估偏倚对研究结果的可能影响。研究人员可以采取两种方法对未应答所造成的偏倚进行评估：第一种方法是从未应答者中随机抽取一个小样本，尽量收集其相关信息，评价偏倚大小及其影响。如果可能，研究人员应尽量鼓励被抽中的对象参与研究。第二种方法是尽量利用现有信息登记系统中的数据，比较应答者和未应答者的基本特征是否有差异。

例1-9　虽然有1 725个女孩和1 592个男孩参加了欧洲3国的研究，但是只有1 156个女孩和1 045个男孩的加速传感器收集到符合标准的有效数据。在这些儿童中，收集到完整的危险因素数据的女孩和男孩分别为915人和817人。研究人员比较了数据完整与数据不全的研究对象，发现他们的年龄、身高、体重、体重指数（BMI）、高密度脂蛋白胆固醇、四皮褶厚度总和与腰围等指标没有差异。两组在心肺功能、收缩期血压、血糖、总胆固醇、甘油三酯、胰岛素和稳态模型评估（HOMA）等方面存在差异。

例1-10　研究人员比较了报告与未报告健康习惯的体检对象的膝关节炎（放射学诊断）的患病率和基本特征（年龄、性别、BMI），这些变量的差异没有显著性。

如果现有信息管理系统已经包含研究所需的数据，并且数据质量符合抽样和分析的要求，研究人员可以利用现有数据进行研究，而不用专门开展横断面调查。

第二节 研究设计