购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2 医学统计学工作步骤

医学统计学的工作步骤就是我们科研过程中,统计学参与专业研究的过程,一般包括设计、搜集、整理、分析、统计表达与统计报告五个步骤,其实就是构思菜谱、到菜场买菜、回家洗菜和配菜、下锅烧菜、装盘上桌的过程。

1.2.1 设计

科研设计是对科研过程整体的运筹帷幄,是对即将开展的研究全流程的推演,一个良好的科研设计规划是试验顺利实施的安全保障。科研设计包括专业设计和统计设计。

1.专业设计

专业设计主要从“三要素”(处理因素、受试对象和试验效应)方面进行规范。以治疗高血压为例,处理因素主要考虑采用何种措施进行高血压治疗;这种措施如何添加;添加的操作规范,如选择哪种降压药;该种降压药的服用剂量、服用疗程、何时服用等。

(1)处理因素的选择是研究的主要目的,干预措施的添加一定要规范、标准化、具有操作性。

(2)受试对象是干预措施作用的对象,受试对象一定要对干预措施的作用具有敏感性、特异性和稳定性。例如,在高血压患者中,我们常选择Ⅱ期高血压患者作为对象。因为I期高血压患者对药物作用过于敏感,即一旦吃药血压就发生较大的波动,而Ⅲ期高血压患者对药物又不太敏感,因为Ⅲ期高血压患者前期一般都吃过多年药物,此时已经对药不敏感,吃药后,血压不容易发生波动。特异性是指血压的波动是由干预措施导致的,而不是其他因素导致的;稳定性是指受试对象对处理因素的反应比较稳定,而不是忽上忽下,忽有忽无。

(3)试验效应是指干预措施作用于受试对象后,受试对象发生的反应,通常表现为某些指标的变化。试验效应的指标尽量选择客观、灵敏的指标。客观指标是指通过某种客观化的方法检测出来的指标,而非研究者的主观判定,如高血压可以通过血压计进行测量属于客观指标,而询问病人的感受,或者医生主观判断病人的症候均属于主观指标,科学研究尽可能选择客观指标。当试验特殊,无客观指标时,选择主观指标应该由多名资深的研究者对病人进行判断。灵敏性是指选择的疗效指标对处理因素敏感。

2.统计设计

统计设计的原则包括随机化原则、对照原则、重复原则和均衡原则,对于临床试验还应遵循盲法原则。

(1)随机化原则包括随机化抽样、随机化分组和随机化顺序。随机化抽样是为了让研究样本具有代表性,能够代表总体;随机化分组是为了组间受试对象具有可比性;随机化顺序是为了消除先后顺序的影响。

(2)对照原则:对照就是为了比较,如果没有对照组,则不能分清楚到底是处理因素的效应,还是受试对象该指标的正常生理波动或自我修复。

(3)重复原则:统计学的重复包括样本量重复、试验重复和观测次数重复。样本量重复是指研究的受试对象需要满足一定的数量,因为统计学是在群体水平上发现事物背后的规律的,受试对象必须满足一定的数量,得到的规律才稳定可靠。试验重复是指一批受试对象的试验结果,在不同时间和地点要能够重现,因为科学的东西都是经得起再现的。观测次数重复是指我们检测试验效应时,要多检测几次以获得稳定的试验效应,如监测血压,通常不是测量一次就记录结果,往往重复测量2~3次,然后才记录结果。

(4)均衡原则是指除了研究因素,其他所有的因素在试验组和对照组之间无统计学差异,均衡可比,其目的就是在比较主要研究因素时,消除一些可能的干扰因素的影响。随机化是实现均衡的一种方法,对于一些观察性研究,不能随机分组时,我们可以通过匹配或倾向性评分来进行组间均衡性的校正。

(5)盲法原则是指在以患者为研究对象的临床试验中,让试验的不同参与方不知道试验的具体分组方案,包括单盲、双盲、三盲。单盲是指受试的患者不知道自己被分到试验组还是对照组;双盲是指受试患者和试验观察者(临床医生)均不知道试验的分组情况;三盲是指患者、医生和统计分析人员三方均不知道试验分组情况。受试患者不知道自己的分组时,在涉及某些病人主观反应指标时,如头晕、头痛等,就可以消除心理作用;医生不知道试验分组时,在获取主观指标时就不会有心理预期,如包块的软硬度、某些症状评分等;统计分析人员不知道临床分组时,在处理数据时,就会严格遵守统计规范,不对数据进行轻易的取舍。

1.2.2 搜集

设计是构思和运筹帷幄的过程。对于统计学而言,实施研究就是数据(资料)的收集过程。简单类比一下,数据搜集就是去菜场或超市买菜的过程。统计学数据收集主要有以下三种形式。

(1)专题试验或调查。这是科研数据的主要收集形式,根据研究者的研究目的,安排专项试验或调查,以主动获取数据。

(2)日常工作记录。这部分数据来自各个部门的日常工作记录,如医院的病历、气象部门的气象数据、校医院大学生的健康数据、共享单车的出行数据、某人的消费记录等。

(3)发表的文献。我们也可以利用别人发表的成果中的数据进行二次分析,如在文献计量学、系统评价与Meta分析中,都可以利用文献数据库对搜集的文献进行二次分析。

1.2.3 整理

所谓“巧妇难为无米之炊”,虽然有了数据就可以进行后续的分析,但在正式分析之前,还有一项非常重要的工作,那就是数据整理与清洗。这个过程需要专业人士和统计师一起完成。根据经验,数据整理和分析所花的时间比约为7∶3。统计分析之前要进行大量的数据整理与清洗。通常做法是拿到数据之后,要先理解数据背后的专业意义,这叫作专业理解,不理解数据背后的意义就进行统计分析是没有“血肉”的。专业理解之后通常需要做以下几步。

(1)查漏补缺:核查数据是否有缺项,并查看原始数据,如调查表或试验记录是否应该有该项。对于缺失的数据,考虑直接删除该记录或采用缺失值替换或多重插补。

(2)查看异常值:基于专业进行逻辑审查,查看是否有异常值,后续考虑是否进行敏感性分析。

(3)看数据分布:对于数值变量,制作频数表或直方图;对于分类变量,制作交叉表。

1.2.4 分析

虽然分析是最体现统计技术的方面,但一些好的分析技术或分析结果的前提是前面流程科学且可靠的实施。统计分析一定要科学且可靠,否则会浪费好的数据。统计学的数据分析可以理解为以下三个层次。

1.描述性分析

描述性分析就是对数据的属性和特征进行描述,通常可以采用统计指标和统计图表来呈现。这些内容在后面都有对应的章节,此处再不赘述。

2.差异/一致性分析

差异性分析是指采用统计分析方法对数据分组进行组间差异性比较,以确定组间差异到底是由处理措施导致的还是随机误差导致的;一致性分析是评估不同评价方法对同一受试对象进行评价时,所得结果是否一致。差异性与一致性是一个事物的两个方面,关注的侧重点不同,如图1.4所示。

图1.4 差异性与一致性示意图

3.关系性分析

关系性分析是指通过研究数据变量之间的相关关系,判定变量之间关系的远近和强弱;通过回归模型的构建,来预测或控制变量。关系性分析是统计学分析的高级应用,掌握难度较大,需要具备一定的统计功力与实战经验,方能很好地驾驭。

1.2.5 统计表达与统计报告

统计表达是对统计分析结果的展示,而医学统计报告是对整个试验统计结果的汇报。国际上和国内对科研结果的表达与报告都有相应的规范。医学论文主要报告规范包括随机试验CONSORT及其扩展、观察性研究(STROBE)及其扩展、系统综述与meta分析及其扩展(PRISMA)、诊断试验(STARD)、临床预测(TRIPOD)、病理报告及其扩展(CARE)、研究方案(SPIRIT)、临床实践指南、定性研究、临床前动物研究、经济学研究等。这些规范均免费发布,大家可以从网络上获取并学习,如EQUATOR网站提供了医学方面各种研究的声明(见图1.5)。

图1.5 EQUATOR网站截图 /xLVuYl8/hHI/nOh+HTnyxrAK6mYyRx97VvfyQ3W4dVCnO6ehQehpdybtGwp4lDz

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开