临床研究(例如临床试验)是向参与的受试者提供尚未证明比现有药物更优的药物,在许多情况下还要向对照组提供安慰剂治疗,安慰剂没有任何治疗作用,仅能引起病人短暂的良性心理反应。这样就遇到一个伦理问题:临床伦理学要求医生给病人提供现有最佳疗法(根据有益原则,落实到临床,就是符合病人最佳利益原则),怎么能给病人提供其安全和有效性尚未得到证明的甚至没有任何治疗作用的安慰剂呢?弗里德曼(Beujamin Freedman)发明了“均势”(equipoise)概念,试图解决这个伦理问题。
弗里德曼的意思是,如果要使临床研究能够得到伦理学的辩护,要求受试的新药与现有的已证明为最佳药物处于均势状态,即临床研究人员对试验中的两个组(试验组和对照组)孰优孰劣存在着不确定性。如果研究人员发现其中一组的治疗效果优于其他,那么他就有义务提供这种治疗。目前对这一要求的理解是,在这个试验过程中研究人员没有“治疗偏好”(treatment preference)。但这种解释有一个问题:临床医生往往对某种治疗拥有不同程度的偏好,有的偏向于待试验的新药,也有的偏向于目前已经证明的最佳疗法。这样的话,在任何时候进行临床试验都不能得到伦理学的辩护,因为你不能消除临床医生的偏好。 [2] 于是,弗里德曼发明“均势”这个概念,试图解决临床试验在伦理学上的可辩护性问题。按照均势概念,如果在医学专家共同体内对哪一种疗法较优存在着不确定性,那么进行临床试验就能得到伦理学的辩护,不管临床研究人员的偏好如何。
弗里德曼认为,伦理学要求临床试验从零假说(null hypothesis)开始。 [3] 零假说是指假设在临床试验中试验组与对照组的结果在统计学上没有显著的差异。零假说是研究人员在整个试验期间的默认立场,直到试验的数据打破均势为止,即数据证明在A与B之间有一个更好。换言之,在确定的病人群体P内,受试的新疗法为B,而目前已经被接受的疗法为A,研究人员对A和B对病人的治疗价值孰优孰劣处于不确定状态。弗里德曼遵循弗莱德(C.Fried)的看法,将A和B的这种不确定状态称为“均势”。 [4] 均势是所有临床试验在伦理学上的必要条件。如若试验有若干组,在试验的所有组内都必须存在所有组之间;否则就应该修改试验设计以排除较差的疗法。如果在试验过程中均势被打破,那么试验必须终止,以前被招募的所有受试者以及在有关人群内所有其他病人都必须给予较优的疗法。对仅在没有已知治疗的研究条件下试验使用安慰剂是否合乎伦理有过激烈的争论。弗里德曼认为,这种争论也反映了均势要求的特殊应用。虽然均势一般是在随机对照试验的特殊语境下讨论的 [5] ,但均势是所有对照临床试验的伦理条件,不管这个试验是随机的、安慰剂对照还是使用盲法的。
弗里德曼指出,对使用人类受试者的研究伦理学注意的增加,也突出了与均势关联的问题。有证据表明,研究人员不能满足均势要求可能注定使试验失败,因为不能招募足够的受试者。现在提出的解决办法不能解决试验进行不下去的问题,因为这些问题是基于对均势本身的错误概念。
均势要求引起许多问题。第一个问题是,在试验开始之前,医生知道在两组之间哪一组更优还进行试验是否合乎伦理。例如肖(L.Shaw)和查谟尔斯(T.Chalmers)认为,一个临床医生如果知道或者有充分理由相信试验的某一组较优,那么他参与试验是不符合伦理的。 [6] 霍伦伯格(N.Hollenberg)等人则认为促使试验进行的推理或初步结果(其本身在伦理上可能是必要的) [7] 也许在试验开始之前就使研究者认为(如果不是他或她的同事)均势已被打破。即使研究者在死亡率和发病率等总体指标上仍在A和B之间悬而未决,但由于生活质量的明显差异(如两种手术后的结局在这方面很不相同)也会打破均势。 [8] 在这两种情况下,研究人员说:“我们不知道”A或B哪一个更好,那就可能给潜在的受试者创造了一个虚假的印象,他们在倾听研究人员说“没有证据向那边倾斜”,意思是“对照研究还没有得出具有统计学意义的结果”,这样研究人员就误导了受试者。
第二个问题是,在研究后期,当P值达到0.05—0.06之间时,试验各组之间已出现统计学上显著的差异,均势的道德问题已很明显。在临床试验的封闭统计范围内,显示试验各组间有差异的每一次结果对统计学结论(即存在)的贡献与其他任何试验结果的贡献都是一样。因此研究人员每次试验之后都要考虑,均势是否已经受到干扰。因为如果均势业已打破,则应考虑终止试验,不再招募受试者。 [9]
第三个问题是,招募失败问题。泰勒(K.Taylor)等人 [10] 在一篇论文中描述了乳腺癌替代治疗试验的终止,引起了人们极大的兴趣。该试验的失败在于招募患者方面存在的问题,研究人员认为招募患者的困难很大程度上是由于研究人员在试验各组方面没有处于均势状态。随着人们对研究伦理学的关注以及医学和研究生院课程中这一主题越来越多地出现,泰勒和她的同事所描述的这类案例可能会变得越来越普遍。因此,均衡的要求对临床研究构成了实际的威胁。
弗里德曼认为,目前对至多仅可解决一部分均势问题,不完全令人满意。第一种解决办法是试验一开始就随机化。查谟尔斯的解决办法是建议从第一个受试者开始就随机化。然而,如果没有初步的、未设对照的数据来支持实验性疗法B,那么疗法A和疗法B对于病人群体P的均势就不会受到干扰。然而,这种办法有若干困难。实际上,在对照试验开始前,往往有必要通过对人体的非对照试验确定给药、剂量等细节。此外,研究人员的均势很可能在假说正在形成和研究方案正在准备时受到干扰。除了这些问题,初始随机化不会解决在试验过程中出现的均衡受到干扰的问题。
第二种解决办法是依靠数据监督委员会。已建议设立数据监督委员会,以解决在试验过程中出现的问题。 [11] 这些委员会的运作独立于研究人员,是唯一掌握有关正在进行的试验结果信息的机构。由于研究人员不了解这些情况,所以他们的均势没有受到影响。虽然委员会有助于使试验摆脱偏见,但不能解决研究人员的道德困难。临床医生不仅有义务根据他或她目前掌握的信息对病人进行治疗,而且还需要发现与治疗决策相关的信息。如果中期结果会干扰均势,研究人员有义务收集和使用这些信息。他们同意对初步结果不知情是一种不道德的协议,就像不让化验室找出病人的检验结果是不道德的一样。此外,监督委员会并不能解决在试验之前和开始时出现的均势问题。
第三种解决办法颇为激进。由于在要求提供给病人已知最佳疗法与临床试验之间存在着一个无法解决的冲突,有人建议弱化“最佳疗法”的要求。谢弗尔(A.Schafer)争辩说,均势概念以及与之相关的最佳医疗的概念,取决于患者的判断,而不是临床研究人员的判断。 [12] 虽然如果研究人员倾向于B而不是A,他的均势可能被扰乱,但最终选择取决于患者的,因为病人的价值可以恢复均势。他论证说,当病人同意时,研究人员继续进行试验就合乎伦理。他的办法是针对测试已知和不同副作用的治疗的试验,而在测试疗效或未知副作用的试验中可能不会有用。此外,这种办法混淆了有能力的医疗实践的伦理与同意的伦理。如果我们假定,研究人员是一个有能力的医生,说研究人员已经打破均势,那就是说根据研究人员的专业判断,考虑到治疗后的生活质量,一种疗法对于这个病人和这样的病情在治疗上处于劣势。即使病人同意接受较差的治疗,提供这种疗法违反了有能力的医疗实践,因此也违反了伦理学。当然,当病人拒绝医生认为最好的疗法而要求较差的疗法时,就可能会产生复杂的问题。然而,由于谢弗尔未能解决这个问题,我们可以拒绝他的办法。因为他声称,为了继续进行临床试验,医生提供较差的治疗是合乎伦理的。
第四种办法是梅尔(P.Meier) [13] 的建议。他说,我们大多数人都很愿意为了学习有价值的东西而放弃适度的预期收益。我们接受日常生活中的风险来获得种种受益,包括方便和经济。同样,即使受试者在整个试验过程中可能得不到最好的疗法,招募受试者参加临床试验也是可以接受的。根据这一办法,通过临床试验取得医学知识的持续进步要求明确放弃医生完全以病人为中心的伦理观念。这是通过放弃需要均势来解决均势的伦理问题。这种办法值得怀疑。
虽然很多人可能是利他的,为了科学的进步而放弃最佳的治疗,但也有很多人不是。维持试验结果的统计学有效性所要求的数量和比例提示,在没有压倒一切的利他主义的情况下,将不可能招募到令人满意的患者数量。特别是重病患者,许多最重要的临床试验都针对他们,他们可能不太愿意利他。均势问题困扰着研究人员和患者。即使病人准备放弃最佳的治疗,他们的医生出于伦理学和专业精神的理由,很可能不愿意这样做。
第五种办法是马尔奎斯(Marquis) [14] 提出的。他说,也许我们需要这样一种伦理学,来为征用医学研究受试者进行辩护。然而,虽然征用的办法可能使我们继续目前的做法,但它几乎得不到任何辩护。此外,征用受试者,也要征用医生—研究人员,因为均势问题既困扰受试者,也困扰临床医生。弗里德曼于是问:有没有不那么激进,然而更为合理的办法呢?
上面讨论的均势问题来自对这个概念的特定理解,弗里德曼称之为“理论均势”。这种理解在概念上是奇怪的,在伦理学上也是不相干的。理论均势存在于当两种治疗方案的证据完全均势时。这种证据可能有多种来源,包括来自文献的数据、非对照的经验、对基础科学和基本生理过程的考虑,以及可能来自(或叠加在)其他考虑的“直觉”或“本能”。上面讨论的问题基于这样一个原则:如果理论均势被打破,医生就有一种“治疗偏好”——比如倾向于实验性治疗B。为破坏这种治疗偏好,就要求招募一些病人来对A和B进行检验的试验。弗里德曼认为,理论均势有如下特点:
其一,理论均势是极其脆弱的。也就是说,略微增加有利于试验某一组的证据,理论均势就会被扰动。例如,当A比B更成功的概率超过50%时,均势就会被打破。因此,有必要从第一个病人开始就随机分配治疗方案,以免扰乱均势。可以说,理论均势是在刀刃上的均势。
其二,理论均势最适合于简单的假说。零假说必须足够简单和“干净”,以达到良好的均势:在人群P中,在降低死亡率、缩小肿瘤或降低发烧方面是A还是B更优越?临床选择通常更为复杂。选择A或B取决于有效性、一致性、最小或可减轻的副作用和其他因素的组合。例如根据仔细检查有时出现,甚至目的在于检验单个假说的试验实际上涉及更复杂的、多性质的测量措施——例如A和B的“治疗指数”等。
其三,理论均势也对研究人员的注意力和感知的变化莫测高度敏感。由于其脆弱性,只要研究人员感知到不同组之间有差异——无论是否存在真正的差异——理论均势就会被打破。例如,普赖斯科特(R.Prescott) [15] 指出,在大多数试验的某个阶段,曲线显示出视觉上的差异,虽然并不显著,但足以引起伦理上的困难。然而,视觉上的差异纯粹是由收集和分析数据的时机及所采用的研究方法造成的。同样地,研究人员通常使用间隔性量表来测量那些被认为在本质上是连续的现象,例如,疼痛的五分制量表或肿瘤进展的分期。这些间隔性量表可歪曲可得证据,放大实际发现的差异,从而干扰理论均势。
其四,理论均势与个人有关,并具有个体特质性。用谢弗尔 [16] 的话说,当临床医生“甚至可能被贴上偏倚或预感”,“仅仅是直觉性质”的偏好的标签时,它就会受到干扰。忽略这种直觉的研究人员,由于他偏好B而不是A或者向病人推荐A(或有机会随机分配到A)而未能向病人提供建议,就已经违反了均势要求以及向病人建议最佳医疗的要求。
理论均势的问题。弗里德曼认为,这种均势概念的问题应该是明显的。要理解对均势的不同诠释,我们需要回到进行临床试验的基本理由:在临床共同体内,对病人P何种疗法更佳存在着相互冲突的意见。标准疗法是A,但也有一些证据提示,B将更优(因为它的有效性或减少不良副作用或其他一些理由)。在罕见的情况下,当一种新疗法的优越性的第一个证据完全使临床共同体信服时,均势就已经被打破了。或者临床共同体内出现了分歧,一些临床医生支持A,另一些医生支持B。双方都承认对方有证据支持自己的立场,但双方仍认为总体上自己的观点是正确的。专家临床医生之间对首选治疗方案存在实在的专业的分歧,而设置临床试验就是要解决这些分歧。
从弗里德曼上述论述看,对理论均势概念存在着概念的混淆。我们认为,理论均势描述的是一种客观的态势,表明准备受试的新疗法与现有最佳疗法在得到证据支持方面的情况,也就是说,B(新疗法或新药)与A(现有最佳疗法或最佳药物)得到的证据支持不相上下,分不出高低。但是弗里德曼在论述时牵涉到临床医生的直觉、预感,这不会影响理论均势,仅能影响下面要谈的临床均势。在临床对照试验中我们采用双盲法,就可避免临床医生和研究人员的直觉或预感对试验的影响。因此,在随机、对照和双盲法条件下,研究人员的直觉或预感不会影响客观的临床试验过程,理论均势也不是像弗里德曼所说那样脆弱易变。关键是我们对新疗法B与现有最佳疗法A得到证据支持的情况有一个客观的评价。这个评价可以由第三方进行,以不受临床医生或研究人员的主观影响。
弗里德曼指出,进行临床试验时就存在一种“临床均势”的状态。临床专家共同体对受试的不同药物的优劣尚未达成共识。我们可以这样说:试验开始时,对于受试疗法的优缺点必须有临床均势状态,试验必须这样来设计,使之能合理期望,如果它成功地得出结论,临床均势将被打破。换句话说,一个成功的临床试验的结果应该足以令人信服,以解决临床医生之间的争议。
接着弗里德曼解释什么是临床均势。临床均势状态与研究人员的治疗偏好不矛盾。他们必须认识到,不受他们宠爱的疗法,是那些他们认为负责和有能力的同事们所偏好的。即使中期结果有利于研究人员的偏好,例如B疗法,但只要由于样本量有限、未解决可能的副作用或其他因素,那么这些结果太弱而不能影响临床医生共同体的判断,临床均势就会持续。
到了这样的时刻,当支持B的累积证据如此强大,以至于委员会或研究人员相信,开明的临床医生在得知结果后不会仍然支持A,临床均势被打破了。但由于人类判断和说服的随意性,有关试验终止的一些伦理问题仍将存在。例如,在一个已经确立的强大趋势面前,我们还必须因为别人盲目地效忠于一个武断的统计基准而继续试验吗?
弗里德曼认为,很明显,临床均势是一个远比理论均势更弱,也更常见的条件。当理论均势被打破时,在临床均势的基础上进行试验是否合乎伦理?或者正如谢弗尔和其他人所论证的那样,这样做是否违反了医生为病人提供最佳治疗的义务? [17] 让我们假定,研究人员已经决定偏好B,但希望基于临床(非理论)均势存在的理由进行试验。伦理委员会问研究人员,如果他们或他们的家庭成员在人群P中,是否不想用他们偏好的B治疗他们?一个肯定的回答通常被认为对这样一个试验的前景是致命的,但研究人员的回答是肯定的。满足这种弱的均势形式的试验合乎伦理吗?
弗里德曼认为这显然是合乎伦理的。因为正如弗赖德 [18] 所强调的,有能力的(从而合乎伦理的)医学在本质上是社会的而不是个体的。医学的进步依赖于医学和研究共同体内逐渐进步的共识。医学实践的伦理学对基于直觉或基于公开提交给临床共同体的证据不足以及不能令该共同体信服的某种治疗偏好,不管多强大,都不赋予伦理或规范的意义。许可一个人作为医师执业,是在他们证明获得了经专业确认的知识之后,而不是在他们表现出优越的猜测能力之后。对他们行为的规范性判断——例如治疗失当行为——依赖于与医疗从业者共同体所做比较。没有遵循这个共同体没有分享的“治疗偏好”,也没有令共同体信服的信息,也就不可能有指控他在法律或伦理上有治疗不当行动的根据。良药的概念是专业共识的产物。处于临床均势状态,良药在A和B之间做出选择是没有不同的。
弗里德曼认为,与理论均势相比,临床均势是稳健的。因此,在试验开始和结束时的伦理困难在很大程度上得到了缓解。有关同意的困难仍然存在,但这些困难可能也会减少。临床均势强调的不是理论均势所要求的缺乏证据支持一个组而不支持另一个组,而是让患者了解临床医生专家之间实在的分歧。研究人员有“治疗偏好”这一事实,这是可以公开的;事实上,如果这种偏好是确定的,而且不是基于直觉,披露它可能是伦理学的强制性要求。同时需要强调的是,这种偏好并不与其他人分享。一位临床医生认为治疗这个病人偏好用B而不是A,而一位有同等能力的临床医生有相反的偏好,这很可能是一个机会的问题。
临床均势并不取决于隐瞒来自研究人员和受试者的相关信息,也不取决于使用独立的数据监督委员会。相反,它允许研究人员在告知受试者时,恰当地区分被临床共同体接受的有效知识、有前景但不(或者对于新疗法来说不会)普遍令人信服的治疗数据以及仅仅是些直觉。如果被告知的患者拒绝参与,因为他们选择了一个特定的临床医生,并相信他或她的判断——超出了专业共同体共识之外——那只是患者的权利。我们并不征用病人作为临床试验的受试者。
临床均势理论的提出旨在替代人类研究伦理学目前的一些观点。同时,它与许多研究和管理团体所持有的概念密切相关。因此,临床均势是许多人走向研究伦理的一种合理的表述;它并没有改变很多事情,只是说明为什么事情会是现在这个的样子。然而,临床均势理论所提供的精确性确实有助于澄清或重新表述研究伦理学的某些方面。弗里德曼认为临床均势的含义有以下两个方面。
其一,对不可信的疗法(如苦杏仁苷) [19] 进行临床试验是否合乎伦理,存在反复的争论。庸医疗法的追随者往往给进行这种试验带来巨大的政治压力。临床均势理论提示,当一种治疗方案在临床专家共同体内没有得到支持时,试验的首要伦理要求——临床均势——缺失,因此进行这样的试验是不合乎伦理的。
其二,弗里德曼曾批评,临床研究人员为了保证试验结果的有效性而过分缩小试验的条件和假说的倾向。这种倾向无法将试验结果应用于临床实践。临床均势理论为这种批评增加了一些力量。这种倾向不能满足临床研究的第二个伦理要求,因为试验的条件过于特殊,即使成功完成,也无法影响临床决策。
其三,然而,临床均势概念最重要的结果可能是缓解目前对临床试验伦理学的信心危机。正确理解均势,仍然是临床试验的一个符合伦理的条件。这与当前的许多做法是一致的。 [20]
有关临床均势,弗里德曼的论述存在如下的缺点:其一,虽然在临床试验中研究人员可能同时是一位临床医生,但一个人在临床中作为一位临床医生的角色与在临床试验中作为一位研究人员的角色是截然不同的。因此,他在临床中要遵循临床伦理学的要求,与在研究中要遵循研究伦理学的要求是不同的,不可将二者混淆起来。其二,在临床试验中理论均势之存在,以及理论均势之被打破,决定于试验过程中积累的客观的科学的证据。而临床均势之存在以及临床之被打破决定于作为临床专家共同体的成员是否接受试验证据对试验各组的支持度。于是,这里必须增加一条基于理性的伦理学要求,即临床专家共同体的成员必须基于理性接受理论均势的态势,做出理性的选择,否则就是不合乎伦理的。现在对临床研究的监管规定就是基于这一伦理要求,如果试验中获得的数据打破了理论均势,药物监管部门就自然而然将试验中获胜的新药列入标准治疗之内。那就是假定临床均势同时也随之被打破。
(雷瑞鹏)
[1] 编者按:这是对研究伦理学中一篇经典文献的解读。这篇文献由加拿大哲学家Benjamin Freedman1987年发表在《新英格兰医学杂志》317(3):141—145,题为“均势与临床研究伦理学”(Equipoise and ethics of clinical research)。
[2] Levine,R.J.,1986, Ethics and Regulation of Clinical Research ,2nd edition.Baltimore,MD:Urban & Schwarzenberg.
[3] Levine,R.J.,1985,“The use of placebos in randomized clinical trials”, IRB : A Reviews of Human Subjects Research ,7(2):1-4.
[4] Fried,C.,1974, Medical Experimentation : Personal Integrity and Social Policy ,Amsterdam:North-Holland Publishing.
[5] Marquis,D.,1983,“Leaving Therapy To Chance”, Hastings Center Report ,13(4):40-47;Schafer,A.,1982, The Ethics of the Randomized Clinical Trial ,307:719-724.
[6] Shaw,L.W.& Chalmers TC.,1970,“Ethics in cooperative clinical trials”, New England Journal of Medicine ,169:487-495.
[7] Hollenberg,NK.et al.,1980,“Are uncontrolled clinical studies ever justified”? New England Journal of Medicine ,303:1067.
[8] Levine,RJ.& Lebacqz,K.,1979,“Some ethical considerations in clinical trials”, Clinical Pharmacology and Therapeutics ,25:728-741.
[9] Klimt,CR.& Canner,PL.,1979,“Terminating a long-term clinical trial”, Clinical Pharmacology and Therapeutics ,25:641-646;Veatch,RM.,1979,Longitudinal studies,sequential designs and grant renewals:what to do with preliminary data.IRB:A Review of Human Subjects Research 1(4):1-3;Chalmers,T.,1978,The ethics of randomization as a decision-making technique and the problem of informed consent,in Beauchamp,TL.& Walters,L.(eds)Contemporary Issues in Bioethics.Encino,CA.:Dickenson,426-429.
[10] Taylor,KM.et al.,1984,“Physicians reasons for not entering eligible patients in a randomized clinical trial of surgery for breast cancer”, New England Journal of Medicine ,310:1363-1367.
[11] Chalmers,TC.,1979,“Invited remarks”, Clinical and Pharmacological Therapy ,25:649-650.
[12] Schater,A.,1985,“The randomized clinical trial:for whose benefit”? IRB : A Review of Human Subjects Research ,7(2):4-6.
[13] Meier,P.,1979,“Terminating a trial—the ethical problem”, Clinical Pharmacology and Therapeutics ,25:633-640.
[14] Marquis,D.,1983,“Leaving therapy to chance”, Hastings Center Report ,13(4):40-47.
[15] Prescott RJ.,1979,“Feedback of data to participants during clinical trials”,in Tagnon,HJ.& Staquet,MJ.(eds.) Controversies in Cancer : Design of Trials and Treatment ,New York:Masson,pp.55-61.
[16] Schater,A.,1985,“The randomized clinical trial:for whose benefit”? IRB : A Review of Human Subjects Research ,7(2):4-6.
[17] Marquis,D.,1983,“Leaving therapy to chance”, Hastings Center Report ,13(4):40-47;Schafer,A.,1982,“The ethics of the randomized clinical trial”307:719-724;Schater,A.,1985,“The randomized clinical trial:for whose benefit”? IRB : A Review of Human Subjects Research ,7(2):4-6.
[18] Fried,C.,1974, Medical Experimentation : Personal Integrity and Social Policy ,Amsterdam:North-Holland Publishing.
[19] Cowan,DH.,1981,“The ethics of clinical trials of ineffective therapy”, IRB : A Review of Human Subjects Research ,3(5):10-11.
[20] Feinstein,AR.,“An additional basic science for clinical medicine.Ⅱ.The limitations of randomized trials”, Annals of Internal Medicine (1983);99:544-50,New England Journal of Medicine,vol.317,no.3(16 July 1987),pp.141-5.