临床实践指南是指导临床医疗决策的重要参考文件,世界卫生组织及美国医学研究所均指出指南推荐意见的制订需基于现有证据。那么,证据与推荐意见是什么关系呢?证据至推荐意见转化的方法有哪些呢?本节将从对证据、推荐意见的认识入手,为临床实践指南制订者和研究者提供新的解决该问题的思路。
“证”“据”二字在我国可追溯至春秋战国时期,均代指“证据”,多用于判断某种现象/形成某一定论的依据。《现代汉语词典》对“证据”一词进行了明确的定义:“能够证明某事物真实性的有关事实或材料”。在不同情景中,其含义不同。例如,在日常生活中,普通民众的衣、食、住、行等信息可来源于电视、广播、网络等大众媒体;在公安警务系统,刑侦案件的证据可指相关人员录音、视频、指纹、法医鉴定报告等。卫生保健领域与上述领域不同,循证医学创始人Gordon Guyatt等人认为“任何经验性的观察都可以构成潜在的证据,无论其是否被系统或不系统地收集”均可称作为证据。目前,“证据”多指以患者为中心的支持或反对某项治疗方案、诊断技术、护理措施、危险因素等方面的相关研究,如随机对照试验、队列研究、横断面研究,或通过回顾分析现有研究中的信息或数据形成的系统评价/meta分析、临床实践指南、卫生技术评估等,也可包括某一专业领域具有权威性和代表性的专家意见。
可以看出,临床实践指南的制订需要依据“证据”,其本身也可作为“证据”。当为解决某一临床问题时,临床实践指南与随机对照试验、队列研究、病例对照研究等原始研究相同,均可为指导临床工作提供参考。然而,需要注意的是,临床实践指南制订周期较长,可能会出现与最新研究证据相互矛盾的情况。临床医生、护理人员等使用时需结合自身工作经验、患者价值观和意愿综合判断。
在医疗卫生保健领域,“推荐意见”一词多用于临床实践指南的文本中,多指针对某个或某类临床问题提出的用以指导诊断、治疗、预后、护理、管理等方面的建议,描述建议的文本多备注证据及推荐等级的标志。例如,《新型冠状病毒肺炎药物预防、诊断、治疗与出院管理循证临床实践指南(更新版)》一文,以“临床问题—推荐意见—证据总结—推荐理由”的架构呈现指南的核心内容,其中针对“对于疑似COVID-19患者,IgM和IgG抗体联合核酸RT-PCR检测的诊断准确性(敏感度、特异度、阳性预测值或阴性预测值)是否优于单独核酸RT-PCR检测?”这一临床问题,指南提出“临床诊断者应在发病后10~14d接受IgM和IgG抗体检测。IgM和IgG抗体联合检测优于单独IgM或IgG抗体检测(Grade 1C)”这一推荐意见,“临床诊断者应在发病后10~14d接受IgM和IgG抗体检测。IgM和IgG抗体联合检测优于单独IgM或IgG抗体检测”即为推荐意见的内容,“Grade 1C”即为该内容的证据及推荐强度等级。
本书第二章第六节详细阐述了证据及推荐强度分级标准的演进过程。可以看出,证据与推荐意见之间的关系分为3个阶段:第一阶段,证据级别与推荐强度无明确关联,如1979年CTFPHE证据分级及推荐强度标准中,基于试验设计对证据进行分级,根据支持或不支持考虑该疾病的“证据充分”“证据尚可”将推荐强度分为“A、B、C、D、E”5个等级,未明确阐述两者之间的关系。第二阶段,考虑证据质量对推荐强度的影响,证据质量等级与推荐强度等级一一对应,高质量的证据越容易给出强推荐,低质量的证据越容易得出弱推荐。例如,1986年David Sackett证据分级及推荐强度首次对Ⅰ级证据的RCT定义了质量标准,认为大样本RCT(Ⅰ、Ⅱ型错误都较低)优于小样本RCT(Ⅰ、Ⅱ型错误都较高),推荐强度与之相对应。第三阶段,证据级别不再与推荐强度一一对应(高质量证据推荐强度不一定高)。证据质量只是作为制订推荐强度时考虑的因素之一。推荐意见的制订仍需要综合考量可行性、可接受性、可实施性、公平性等。例如,2004年GRADE证据等级及推荐强度分级标准指出制订推荐意见时需考虑利弊平衡、患者的价值观和意愿、研究之间的(不一致性、不精确性、间接性、发表偏倚)等,并从患者、医生、政策制订者的角度对推荐强度提出了分级标准。
现有很多国际指南制订组织机构及学术组织如世界卫生组织、英国艾滋病学会、美国传染病学会、苏格兰校际指南协作网、澳大利亚Joanna Briggs循证卫生保健中心相继发布了指南制订方法学指导性文件,明确指出制订推荐意见时需要考虑的因素。不同组织间既有相同的部分,又有不一致的方面。目前国际上常考虑的因素包括证据质量、可接受性、可行性、公平性、资源利用、患者的价值观和意愿、利弊平衡。
推荐意见的内容来源于相关研究的结果或结论。研究证据的可靠性直接影响推荐意见的应用价值。指南制订手册中均指出在制订推荐意见时需考虑证据质量。GRADE工作组提出证据质量是指对预测值的真实性的把握程度。指南制订可使用相应的方法学质量评价工具进行评估,如使用Cochrane ROB 2.0评价随机对照试验的质量,采用QUADAS-2评价诊断准确性研究的质量,应用AMSTAR 2评估系统评价的质量。需要注意的是,不同组织或机构对“证据质量”的定义有所不同,欧洲人类生殖与胚胎学会、美国临床肿瘤学会、纽约州立大学等认为证据质量可以是单个或多个研究的质量,也可以是系统评价的质量。以GRADE工作组为代表机构则认为在指南制订过程中,“证据质量”即以“证据体”(body of evidence)为单位对证据进行质量分级,“证据体”即为系统评价的效应指标,其质量需考虑系统评价纳入原始研究的局限性、不一致性、间接性、发表偏倚等因素而综合评定。WHO指南制订手册指出证据质量越高,强烈推荐的可能性越大。
可接受性是指指南的目标人群如医务人员、患者及家属、政策制订者等对推荐意见的接受程度。WHO、苏格兰校际指南协作网、欧洲人类生殖与胚胎学会等国际组织或机构推荐在制订推荐意见时评估其可接受性。目前,主要通过3种方式获取这方面的信息:第一,邀请具有丰富工作经验的、代表性的目标人群参与指南拟推荐意见的论证过程;第二,通过现有文献,了解目标人群对该推荐意见涉及方案的偏好和意愿;第三,采用定性研究、定量研究或两者结合的方式开展现况研究,了解指南拟应用机构相关人员对推荐意见的可接受性的看法和建议。对所有或大多数利益相关者来说,某项干预方案或诊疗策略等的可接受性越大,强烈推荐的可能性就越大。
在指南制订过程中,“可行性”主要是指推荐意见在拟推广应用的相关实际环境中可实施性,也被称为“可实施性”。为获取该信息,大多指南制订小组采用问卷调研、文献检索、质性访谈等方式了解推荐意见在未来实施时可能的促进因素或障碍因素,便于提出针对性的指导建议。例如,“艾滋病临床护理实践指南”制订小组,针对指南推荐意见草案设计调研问卷,对某艾滋病定点诊疗机构艾滋病病房或门诊的艾滋病科护士开展围绕指南的临床可应用性进行调研,结合推荐意见内容特点,提供“应用是安全的”“应用后是有效的”“应用是可操作的”“应用是符合伦理的”“可能的解释”选项以供被调查者选择,其中“可能的解释”需提供可能影响应用的因素,如人力配置问题、观念上似乎还不接受、护士的专科能力尚不够。指南构建小组后续结合可应用性调研结果进行专家论证,对指南中存在的问题进行讨论和解决,并形成指南终稿。如果某项推荐意见内容对于所有或大多数利益相关者来说可行性越高,强推荐的可能性就越大。有时,可行性可能与患者的价值观和意愿、资源利用、宗教信仰等其他考虑相重叠。
公平性是制订推荐意见时考虑的其中一个因素。世界卫生组织、英国国家卫生与临床优化研究所、欧洲人类生殖与胚胎学会、苏格兰校际指南协作网、美国临床肿瘤学会等组织制订指南制订手册明确肯定公平性对推荐意见强度的影响。该因素聚焦如不同年龄、残障、婚姻与世俗伴侣、种族、宗教信仰、性别等各类人群平等的健康需求。一般情况下,要求指南制订小组提出推荐意见时需考虑是否会对上述人群产生不同的影响。
合理使用当地医疗机构的人力、物力资源是推荐意见得以实施的前提条件。因此,制订推荐意见时需考虑可能存在的医疗资源成本消耗问题。现有临床实践指南多单纯以“成本”(如与治疗有关的经济负担、随访管理中可能的成本消耗)考量潜在的资源问题,鲜有依据对卫生投入和健康结果进行比较使有限的卫生资源得到合理配置和有效利用的经济学证据。究其原因,现有的临床试验往往只关注临床疗效,不考虑资源消耗问题,很少进行经济学评估。指南制订组织或机构可邀请卫生经济学家参与,在缺乏经济学证据时,指导在短时间内制作小型的卫生技术评估报告或协助指南小组考虑相关方案的资源使用和成本的可能差异,得出干预或服务可能的成本效果分析。WHO指南制订手册提出对资源的影响越有利或越不利,就越有可能提出支持或反对干预的强烈建议。
循证医学3个核心要素之一就是患者的价值观和意愿,该要素自诞生至今未曾改变。但“患者价值观和意愿”的定义尚未统一,多数研究者认为其主要是指患者对其健康的看法、认知、期望和目标,或是对治疗方案、医务人员以及医疗设施等的要求及评价,也有研究者认为其是指患者对健康结局认识的相对重要性。世界卫生组织、苏格兰校际指南协作网、美国传染病学会、美国心脏学会基金会/美国心脏协会等指南制订手册均强调在指南制订过程中考虑患者的价值观和意愿的重要意义。关于在指南制订哪一环节考虑“患者的价值观和意愿”以及获取该信息的方法仍在研究中。普遍认为的是,可在明确指南主题或临床问题、形成最终推荐意见时通过邀请患者代表参与指南制订、检索现有系统评价或相关文献、面向目标人群开展横断面调研或者质性研究以获取相关信息。例如,“非肌层浸润性膀胱癌”指南小组设计“非肌层浸润性膀胱癌治疗指南问题及结局指标遴选表”,并进行问卷调研,明确本指南需要解决的36项临床问题清单及包括无病生存期、无进展生存期、总生存期等结局指标。“妊娠期糖尿病临床护理实践指南”指南制订团队对诊断为妊娠期糖尿病的孕产妇进行指南草案中的推荐意见的可接受性论证。一般情况下,目标人权价值观和意愿的不确定性或变异性越少,强烈推荐的可能性越大。
利弊平衡是在形成最终推荐意见的重要因素,其含义有狭义、广义之分。狭义上正如WHO、SIGN指南制订手册所指,其主要关注某项推荐在未来实践过程中可能产生的预期利益与存在的潜在不良影响之间的权衡。这里“利”与“弊”分别代表这项推荐意见预期的利益、潜在的不良风险。也有研究者认为“利”也可包含证据质量、可行性、可接受性、公平性、患者的价值观和意愿等便于推荐意见得以实施的有利因素,反之,则是推荐意见的不利因素。广义上“利弊平衡”更侧重在制订推荐意见时,对所有考量因素的全面评估,其中,往往净效益与净危害之间的平衡起到决定性因素,干预或暴露带来的净效益或净危害越大,支持或反对干预的强烈建议的可能性越大。
证据至推荐意见的转化过程是十分复杂的。国际指南制订机构、各学术组织一直倡导应当保证推荐意见制订过程的系统化、透明化。指南2.0清单也明确指出需采用结构化分析框架和透明系统的过程综合影响推荐意见的因素,选择合适的模块对因素进行总结;对形成推荐意见的共识会议的详细过程进行公开等。目前,国际上最通用的且具有代表性的是DECIDE EtD框架。
DECIDE(developing and evaluating communication strategies to support informed decisions and practice based on evidence)是隶属于GRADE工作组的一个项目,旨在研发和评价促进临床实践指南推广和传播的工具、方法。EtD(evidence to decision)框架是其计划开发的方法之一,用以辅助决策或推荐意见的形成,或帮助指南应用者理解推荐意见产生的过程并判断推荐意见是否适用于当前的临床医疗环境。框架核心内容是根据决策类型(临床决策、医疗保险决策、卫生系统决策、公共卫生决策、诊断或筛检性决策),提出每一决策在制订时需考虑的因素(表2-7-1),并对该因素提出了详细解释(表2-7-2)。EtD框架指导证据至决策形成的主要步骤包括形成问题、评价证据和得出结论。“形成问题”是指推荐意见制订小组需将临床问题结构化,如采用PICO(患者/人群、干预措施、对照措施、结局指标)格式,也需预先明确临床问题适用的目标人群及临床情景等。“评价证据”是指指南制订小组对需考虑标准的证据进行评估,必要时提供其他补充考虑,如常规收集的数据、缺乏证据时进行的合理推测。“得出结论”是指南制订小组依据所考虑因素的综合判断结果,对推荐意见的内容、强度及方向得出最终结论。
为便于指南制订者使用EtD框架,GRADE工作开发了GRADEpro GDT在线操作平台,将各项标准嵌套在平台之中,使用者可以通过菜单式操作,快速将每一标准的判断依据、解释和补充等信息通过表格的形式呈现,并可以逐步完成推荐意见及推荐强度分级、结论总结等步骤。
有学者提出了中医药临床指南和专家共识制订过程中影响推荐意见的因素,见表2-7-3。
表2-7-1 五种不同类型决策的EtD框架标准
表2-7-2 EtD框架标准的判断方法
续表
注: * 证据质量应该作为这些标准的具体判断内容; & 当以个体患者的视角制订推荐意见时,则不考虑这些因素。
表2-7-3 中医药临床指南和专家共识制订过程中影响推荐意见的因素
[1]李幼平,李静.循证医学[M].4版.北京:高等教育出版社,2020:20.
[2]王行环.循证临床实践指南的研发与评价[M].北京:中国协和医科大学出版社,2016:157-158.
[3]JIN Y H,ZHAN Q Y,PENG Z Y,et al.Chemoprophylaxis,diagnosis,treatments,and discharge management of COVID-19:An evidence-based clinical practice guideline(updated version)[J].Mil Med Res,2020,7(1):41.
[4]靳英辉,詹庆元,彭志勇,等.新型冠状病毒肺炎药物预防、诊断、治疗与出院管理循证临床实践指南(更新版)[J].解放军医学杂志,2020,45(10):1003-1031.
[5]靳英辉,曾宪涛.中国非肌层浸润性膀胱癌治疗与监测循证临床实践指南(2018年标准版)[J].现代泌尿外科杂志,2019,24(7):516-542.
[6]章孟星,周英凤,钟婕,等.妊娠期糖尿病临床护理实践指南的整合研究[J].中华护理杂志,2019,54(1):104-113.
[7]桂裕亮,杨亮,曾宪涛,等.临床实践指南制订方法——经济学证据在指南制订中的应用[J].中国循证心血管医学杂志,2018,10(11):1285-1288.
[8]王明辉,张菁,曾宪涛,等.临床实践指南制订方法——患者的价值观和意愿[J].中国循证心血管医学杂志,2018,10(10):1153-1156,1161.
[9]靳英辉,韩斐,王明辉,等.临床实践指南制订方法——证据向推荐意见转化[J].中国循证心血管医学杂志,2018,10(9):1031-1038.
[10]王云云,靳英辉,陈耀龙,等.循证临床实践指南推荐意见形成的方法分析[J].中国循证医学杂志,2017,17(9):1085-1092.
[11]邓通,韩斐,汪洋,等.临床实践指南制订方法——EtD框架在推荐意见制订中的应用[J].中国循证心血管医学杂志,2019,11(5):516-520,525.
[12]李承羽,赵晨,陈耀龙,等.中医药临床指南/共识中推荐意见分级标准的制订[J].中医杂志,2020,61(6):486-492.