证据的检索与评价是指南制订的重要步骤。全面、客观、可重复的文献检索是指南制作过程中最耗时、最具挑战性但又最重要的工作,灵敏的检索策略和多样的检索资源是减少文献查找偏倚的关键。对于检索到的文献也要进行严格的质量评价,最终基于当前可获得的最佳证据基础形成推荐意见。
采用 PICO(population,intervention,comparison,and outcomes)的基本模式构建指南临床问题。根据不同问题适合的研究类型,PICO的格式可能稍有调整:如针对观察性研究的 PECOT(population,exposure,comparison,outcomes,and time)模式,增加时间和机构的PICOTS(population,intervention,comparison,outcomes,time,and setting)模式,增加方法学的PICOM(population,intervention,comparison,outcomes,and methodology)模式。
指南构建时查找证据的类型一般包括临床实践指南、系统评价(systematic reviews,SR)、meta分析、随机对照试验(randomized controlled trials,RCT)、观察性研究、质性研究、专家共识、经济学研究等。
文献的检索一般情况下是按照2001年美国纽约州立大学医学中心(Medical Center of State university of New York)提出的证据金字塔“从高到低”的顺序进行逐级检索(图2-4-1)。
图2-4-1 证据金字塔
证据金字塔的顶端是系统评价/meta分析。一般情况下,如果检索出的与指南临床问题相匹配的系统评价/meta分析质量高且为近2年发表即可直接运用以节省时间及成本,并应注意确定此系统评价检索日期后有没有相关文献发表。如果确定没有相关性高及较高方法学质量的系统评价/meta分析,则需要重新制作以便解决相应的临床问题,此时指南制订者需要明确指南的证据基于系统评价的核心意义是对每个问题进行充分的文献检索和文献结果的批判性阅读和总结,meta分析不是必需的过程。关于指南制订时是否需要重新制作SR的问题详细阐述见本章第五节“证据的系统评价”。
如果没有可用的系统评价,一般需要进行系统的原始研究的检索,此时应依据不同类型的临床问题选择特定研究设计的文献,如诊断性的问题常需查找横断面研究、队列研究,而治疗问题则一般需要查找RCT研究,预后研究需要查找队列研究。各类型问题建议的最佳原始研究证据类型详见表2-4-1。
表2-4-1 各类型问题原始研究文献的证据等级
当存在一些特殊情况,如证据尚未发表、无直接证据、罕见疾病、新发疾病等,检索到合适的研究证据可能存在一定难度。此时,专家可能是证据的唯一或主要来源。例如在新型冠状病毒肺炎疫情暴发初期,缺乏SR、RCT等传统循证证据,但仍需要制订快速建议指南,这时专家证据(expert evidence)就成为指南的重要证据资料,基于专家证据仍然可以制订循证指南。但一定要注意专家意见(expert opinion)不等于专家证据,此过程中应注意区分。
检索式的确定遵循一般检索式构建原则,即主题词与自由词联合检索以尽可能查全。另外检索策略是一个迭代过程,检索式构建过程中需要将多个术语、组面排列组合形成最灵敏和完整的检索策略。需要注意的是制作指南的检索词/检索式区别于制作一般系统评价的检索词/检索式。指南制订时应先检索现有的系统评价,如需重新制订系统评价,则再按照Cochrane系统评价指导手册中的检索策略进行制订、检索。同时,指南一般会涵盖多个PICO问题,可能涉及诊断、治疗、预后等多方面内容,制定检索词时可以针对每个PICO问题进行精确检索,也可以只围绕指南关注的疾病,规定研究类型进行大框架的检索,再针对不同的PICO问题进行文献的筛选。例如,非肌层浸润性膀胱癌治疗与监测的循证临床实践指南的范围涉及该疾病的多种治疗方式,包括多种手术方式、术后化疗、术后免疫治疗、卡介苗膀胱灌注治疗等,该指南的检索式见表2-4-2。
表2-4-2 检索式示例
常用检索资源有指南发布网站/指南制订组织网站、一般生物医学数据库、循证机构或数据库以及重要的专业学会网站等。指南的检索可以在指南发布网站/指南制订组织网站进行,如WHO官网,NICE官网等。更多的指南制订机构及其介绍详见第一章第四节。
Cochrane图书馆、JBI循证卫生保健数据库、Campbell图书馆等循证机构或数据库,及一般生物医学数据库,例如MEDLINE、Embase、中国知网、维普、万方和中国生物医学文献数据库等,可以用来检索确定的主题是否存在已经发表的系统评价。如果尚未找到相关的系统评价,即可以从一般生物医学数据库中进行原始研究的检索。此外,根据情况可能需要进行补充检索,如特定领域的专业数据库、专业学术网站,相关文献的参考文献的追溯等。
制订指南时常常需要获得有效性、安全性、经济性及患者价值观意愿等多方面的证据,以形成客观可实施的推荐意见。NICE手册中指出检索资源应尽可能多地涵盖相关研究,如生物医学、经济、教育、管理、心理、社会学等数据库及网站;会议摘要;正在进行的临床试验等。
证据的方法学质量评价是审查证据的关键阶段,针对不同的研究类型选择合适的方法学质量评价工具是指南制作过程中产生高级别证据的基础。方法学质量评价需要根据不同的研究类型选择相应的评价工具,一般情况如下:①对指南的质量评价:选用国际通用的指南评审工具 AGREE(Appraisal of Guidelines Research and Evaluation in Europe)、AGREE Ⅱ或AGREE-China;②对系统评价或meta分析的质量评价:采用系统评价方法学质量评价工具AMSTAR(A Measure Tool to Assess Systematic Reviews)或AMSTAR 2;③对原始研究:可根据研究设计选择相应的质量评价工具,如对随机对照试验可采用Cochrane图书馆推荐的RCT偏倚风险评估工具,即RoB(Risk of Bias)或RoB 2.0;对诊断性研究可采用诊断准确性研究质量评价工具QUADAS(Quality Assessment of Diagnostic Accuracy Studies)。除上述针对不同研究类型专用的评价工具外,也可以采用英国牛津大学循证医学中心文献严格评价项目CASP(The Critical Appraisals Skills Programme)系列方法学质量评价工具对不同类型的研究进行评价。不同的指南制订手册中给出了针对不同研究类型可以采用的多种可选择的质量评价工具,详见表2-4-3。
表2-4-3 各指南制订手册的检索资源及针对不同研究类型采用的方法学质量评价
续表
注:CENTRAL,Cochrane Central Register of Controlled Trials,Cochrane临床对照试验中心注册库;BNI,British Nursing Index,英国护理索引数据库;CDSR,Cochrane Database of Systematic Reviews,Cochrane系统评价数据库;DARE,Database of Abstracts of Reviews of Effects,疗效评价文摘库;ROBIS,The risk of bias in systematic reviews,系统综述偏倚风险评价工具;NOS,Newcastle-Ottowa scale,纽卡斯尔-渥太华量表;IHE,Institute of Health Economics,卫生经济学研究所;MERGE:Method for Evaluating Research and Guideline Evidence,评估研究和指南证据的方法。
对现存指南的检索可以帮助指南制订者整理思路,通过确定现有指南的概况,可以有针对性地解决尚未解决或有争议的临床问题进而避免资源重复和浪费,也可以对高质量国际指南进行改编,使其本土化。
其次,现有指南推荐意见的分析也可以作为新指南构建的参考资料。指南的制订者应尽可能与现存相关指南制作团队取得联系,以获得其支持和合作,例如进行信息共享,尤其是已获得的高质量证据及评价资料的共享可以最大限度地节省资源成本。制作指南需要投入大量的人力、物力及经费,建议新指南的制订者尽可能运用已有的高质量指南作为“资源”或“种子”,且说明参照指南的来源以及获得的版权许可。不建议指南制订者重复文献搜索,但是新指南制订者应该进行补充检索,即检索已发布指南检索日期后的相关文献,且文献检索应特别针对本地研究和最近发表的RCT和meta分析。
高质量现存指南也可以作为较好的基础资料以供新指南制订者学习,如其标准的制作流程、完整的原始证据表格等,均可为指南的更新和文献的批判性评估和审查奠定基础。
指南制订的过程中,应该就所关注领域的问题制定高效的检索策略并选择合适的数据库,进行系统、全面的检索。在制定检索策略时,要在追求全面性和保持相关性之间取得平衡。采用恰当的方法学质量评价工具对文献进行批判性评估从而优选高质量文献,保证指南中的每一条推荐意见均基于当前最佳证据的综合。
意见指关于某事的观点或判断,且不一定基于事实,而证据指支撑结论的事实(实际情况或论断主张)。Holger J Schünemann等人将专家证据定义为在特定领域知识渊博或技术熟练的人所提供的观察结果和经验反馈。专家证据包括对证据的判断。在参与制订推荐意见时,专家有必要清楚说明自己所提意见的支撑证据。如果专家仅提出意见(结论),但并没有明确给出支撑证据,则无法知道该意见的证据基础是什么,以及该意见的可信度如何。应对专家证据进行系统地收集,并在形成推荐意见的会议召开前,将专家证据提供给专家组成员。
如果对证据总结得当,可以采用与病例报告或病例系列研究相同的方式对专家证据进行评价。例如对罕见病来说,可以用来制订推荐意见和说明干预效果的研究证据非常少。在制订指南时可以请专家给出他们接触过的患者数量,并对各种干预措施的效果进行预估,然后使用结构化表格对上述信息进行收集整理并作为调查结果总结提交给指南专家组。
最后应注意的是,并不是所有的指南制订团队都有额外的条件和资源对专家证据进行正式地收集和评价。一般情况下,我们希望降低专家证据或更为常见的专家意见在形成推荐意见过程中的权重。除非研究证据不可用或不充分,否则我们不建议用专家证据代替研究证据。
近来有研究者提出,指南通常是基于传统的随机对照试验(RCT)的证据,虽然这些证据有高度的内部真实性,但缺乏外部真实性,即试验的人群不一定与日常治疗中的特定患者相对应,基于这些RCT的指南通常会出现试验有效性与实际有效性之间存在差距的情况,这是导致医师对指南依从性差的常见原因之一。真实世界证据(real world evidence,RWE)是指通过对适用的真实世界数据进行恰当和充分的分析所获得的关于药物的使用情况和潜在获益-风险的临床证据,包括通过对回顾性或前瞻性观察性研究或者实效性临床试验等干预性研究获得的证据。
Chew SY等研究者认为RWE可以作为临床实践指南开发中的RCT证据的补充,因为其代表了一线医生和患者的广泛、多样的集体经验,可以通过平衡有关检查或治疗在理想环境下是否有效(效能,efficacy)与其在真实环境下是否有效(效果,effectiveness)的信息来填补当前指南中的空白。这将使指南制订者不仅可以更精确地确定是否建议进行某项临床检查或治疗,还可以确定针对谁和何时进行,从而来推进精准医疗的进程。
Steels S等人以在初级保健的抗生素处方指南中使用观察性数据为案例,对来自英国国家卫生与临床优化研究所(NICE)的指南制订者进行了访谈,对其观点进行了分析汇总,以评估真实世界数据在治疗性指南制订中的作用。指南制订者们普遍认为,在国家或地方指南制订中应使用更广泛的证据,而不是依靠符合NICE规定的严格标准的系统综述和RCT。纳入观察数据将有助于加强指南的制订过程,并为监测临床实践中的指南使用情况以及改善初级保健中指南的实施提供潜在的解决方案。
未来真实世界证据能否作为研究证据纳入指南以及其如何作为RCT的证据补充纳入指南,都需要更多的讨论和研究。
[1]National Institute for Health and Care Excellence..Developing Nice Guidelines the Manual [EB/OL].[2020-12-16]. https://www.nice.org.uk/process/pmg20/chapter/introduction.
[2]World Health Organization.WHO Handbook for Guideline Development[EB/OL].2nd ed.[2020-12-16]. https://www.who.int/publications/i/item/9789241548960.
[3]Minds Guideline Center,Japan Council for Quality Health Care(2014).Minds Handbook for Clinical Practice Guideline Development 2014[EB/OL].[2020-12-16]. http://www.en.jcqhc.or.jp/.
[4]SIGN.A guideline developer's handbook[EB/OL].[2020-12-16]. https://www.sign.ac.uk/media/1050/sign50_2019.pdf.
[5]靳英辉,蔡林,程真顺,等.新型冠状病毒(2019-nCoV)感染的肺炎诊疗快速建议指南(完整版)[J].医学新知,2020,30(1):35-64.
[6]靳英辉,曾宪涛,刘同族,等.非肌层浸润性膀胱癌治疗与监测循证临床实践指南研究方案[J].中国研究型医院,2018,5(3):42-51.
[7]SCHÜNEMANN H J,ZHANG Y,OXMAN A D.Distinguishing opinion from evidence in guidelines[J].BMJ,2019,366:l4606.
[8]CHEW S Y,KOH M S,LOO C M,et al.Making Clinical Practice Guidelines Pragmatic:How Big Data and Real World Evidence Can Close the Gap[J].Ann Acad Med Singap,2018,47(12):523-527.
[9]STEELS S,VAN DER ZANDE M,VAN STAA T P.The role of real-world data in the development of treatment guidelines:a case study on guideline developers' opinions about using observational data on antibiotic prescribing in primary care[J].BMC Health Serv Res,2019,19(1):942.