应正确评价和使用循证医学证据
四川大学华西医院神经内科中国循证医学中心
当前,循证医学已成为临床医学中最热门的话题和最频繁出现的新名词之一。随着循证医学更广泛的普及和更加深入人心,一些专家已开始担忧循证医学概念的炒作和过渡使用会带来负面影响。因此有必要对一些容易出现偏差的问题进行阐明,以帮助人们更加恰当地进行循证医学实践。关于循证医学临床实践概念的一些问题已有专文论述。本文主要评述怎样正确认识和使用循证医学的证据,希望对循证医学发展能起到减少偏差的作用。
对于治疗效果的评价,临床研究证据可简要分为五级(可靠性依次降低)。一级:所有随机对照试验(RCT)的系统评价/Meta-分析。二级:单个样本量足够的RCT。三级:设有对照组但未用随机方法分组的研究。四级:无对照的系列病例观察。五级:专家意见。这种分级有助于决策时判断证据的权重。国际公认相对于其他类型的证据,RCT的系统评价或RCT结果是证明某种疗法有效性和安全性最可靠的依据(金标准)。临床实践指南则对怎样根据这些证据来处理患者提供了指导性参考意见。临床医生循证治病最方便的途径是参考指南结合具体病情做出临床决策。但很多时候没有相应的指南可参考。在这种情况下,可从高到低依次参考和使用各级临床研究证据。以下分别讨论怎样正确认识和使用上述各级证据和指南。
1 怎样看待和使用系统评价或Meta分析证据?
所有RCT 的系统评价/ Meta分析证据在循证医学中排位最高,但其前提是系统评价/ Meta分析的质量要高。须知,并非所有的系统评价或Meta 分析结论都是可靠的。同其他研究一样,方法学的正确与否严重影响结果甚至导致错误的结论。系统评价/ Meta 分析在没有经过相关临床流行病学、临床研究设计、统计学等基础知识培训及临床专业培训和经历的情况下是容易出现偏倚的。目前发表系统评价的作者大致分为三大类,即临床工作者、方法学人员(主要从事研究和教学工作)、其他(信息学,管理等)人员等,并以前两类人员占大多数。从笔者近年审稿的情况来看,系统评价/ Meta 分析稿件最普遍和最主要的误区是:① 重Meta 分析的图表和数据的合成,轻对所纳入研究质量的严格评价;②下结论太轻率;③ 文献收集不全面。这些问题都可能带来负面作用,特别是夸大某种疗法的效果。而其中临床工作者常出现的问题是,对研究的方法学质量评价欠重视及统计学方法选择不恰当,但对临床背景及意义较了解;方法学家的问题是对临床背景及意义不熟悉,以致理论上的方法学与现实的临床可行性之间可能脱节,其优势是方法严格但容易教条化。因此,两类人员在做系统评价/ Meta 分析时应注意互相学习和讨论,取长补短。
怎样看待和使用系统评价或Meta 分析证据?David Sackett 等建议,评价一个有关治疗措施的系统评价主要是看:① 结果是否真实可靠,即是否为随机对照试验的系统评价?是否收集和纳入了所有相关研究?是否对单个试验质量进行了评价?各试验之间的同质性是否好?② 结果是否有意义,即效果的幅度和精确性怎样?根据对系统评价结果真实性和意义的评估可以判断其结论的可靠程度和应用价值。目前国内随机对照试验质量普遍较差,系统评价或Meta 分析所纳入的试验多数质量不高,特别需要指出的是,很多研究都未做到真正的随机分组。这种情况下做系统评价或Meta 分析的重点不应该是描述其结果,而应着重严格评价所纳入试验的质量问题,应告诉读者因为存在质量问题,其结果的可靠性较差,进一步的研究应该注意克服那些问题。只有当所纳入研究的质量较高时,其得出有效或无效的结果才较可信。因此,在当前读者使用系统评价或Meta 分析证据时,首要的问题是看其对纳入研究的质量评价是否严格,如果没有质量评价,这篇系统评价结论的可靠性应受到质疑。
2 怎样看待和使用随机对照试验证据?
RCT 证据也是高级别的证据。但也不是所有RCT 证据都可靠。如上所述,目前国内发表的随机对照试验,有相当数量存在严重的质量问题。最突出的是,很多研究自称为RCT,但从方法的描述上可以判断不是真正的随机分组。判断一个临床试验是否可靠,首先应看其是否真正进行了随机分组,可根据是否采取了分配隐藏( allocation concealment)来确定。分配隐藏是指采用一定的方法对患者进行分组,使医生(试验实施者)和患者自己将被分在试验组或对照组不可预知。即对符合纳入标准的患者,负责入组的医生不能知道患者将会分在何组,从而保证患者进入治疗组或对照组的机会均等。其方法包括使用中心控制的电话或传真进行随机分组,用编码的药物容器或序列编号的、密封的、不透光的信封等进行随机分组等。其次要看样本量,小样本的试验因机遇作用容易出现假阴性或假阳性结果,不能轻信。另外还要注意是否采用了盲法判断疗效,没有采用盲法判效者,极易夸大治疗组的效果。其他还包括疗效判断标准、随访时间等。
3 怎样看待和使用有对照但未随机分组的证据?
相对于其他类型的证据,RCT 的系统评价或RCT 结果是证明某种疗法的有效性和安全性最可靠的依据(金标准)。因随机分组是当前能使多种已知、特别是未知的影响预后的因素在两组间达到一致,保证两组可比性的唯一方法。若当前没有这些金标准的研究证据,可依次使用其他类型的证据,但应明确其可靠性降低。当以后出现了更好的证据时则应及时使用更好的证据。这就是循证医学概念中“依据当前可得到的最好临床证据”的意思。因此,除随机对照试验和其系统评价/ Meta 分析外,其他临床研究结果虽是证据但可靠性大大降低。我国目前大量的治疗研究属于这类,包括很多自称为RCT,实际上是没有真正随机分组的研究。在没有条件做RCT 时,这种研究还是有一定的价值。但对这种非随机的临床对照研究应该认识到,他们虽可能控制已知的影响预后的因素但却不能控制未知因素,这就很难区别两组疗效的差异是治疗措施的作用还是未知影响因素的作用。因此与随机对照试验相比其可靠性明显较差,但与无对照的研究相比级别高一些。在临床上,如果没有相应的随机对照试验存在,也可使用这些证据,但要充分认识其局限性。
4 怎样看待和使用无对照的病例观察?
无对照的病例观察主要用于一些新的、有创伤的、或少见病的初步研究。在这些情况下,设置对照组往往有困难,进行无对照的病例观察是初步的研究,其价值在于为进一步的深入研究奠定基础。例如介入治疗、外科手术方法的早期研究等。因为没有对照,可靠性较差,有待进一步研究。在没有对照研究存在时可以作为参考,但可靠性差。
5 怎样看待和使用专家意见?
有学者认为专家意见也是证据。的确,专家的经验,特别是专家将证据与经验结合而提出的观点也是很有价值的。判断专家意见是否可靠,主要根据其观点是否有充分的证据基础,如果没有证据,则可质疑。在缺乏研究证据时,多个专家达成的共识比个人的观点相对更可靠。对于没有研究证据的少见或复杂病情,专家意见有较重要的参考价值。
6 怎样看待和使用指南?
在临床使用指南时,应对其真实性和可靠性进行评价。评价的要点是:① 指南的制定者是否在过去12 个月内对文献进行了全面的复习?② 对作为每一条推荐意见的支持证据是否标记了级别和注明了出处。临床应用指南的方法为:
① 了解指南是怎样制定的,一个真正循证的指南较非循证的指南的可靠性更强。
② 阅读证据水平与推荐意见强度对照表的解释、了解其意义,以便判断推荐意见的可靠程度。
③ 根据推荐意见强度确定临床应用。如果一种疗法的使用为A 级推荐,则基本上没有禁忌证就可以使用;为B 级推荐,可以使用但应注意其证据并不充分,在理由充分时可用或不用,应随时注意新证据的发表;如为C 或D 级推荐,则提示证据更加缺乏,具有更大的不确定性,临床可以使用,但医生应更加灵活,只要理由充分则可选择用或不用。但总的原则是如果没有充分理由,就应该参考指南的意见,因为即使是B 级或C 或D 级推荐,也是大量复习文献和多人多次讨论的结果,比起个人有限的经验来说,其参考价值更大。
结语:循证医学中使用的各级证据包括随机对照试验和系统评价也应该接受严格评价,并非标榜了循证医学的名词就是正确的。同时,对证据的使用不能教条化,理想和现实是有差距的,理想的方法学完美的证据在现实中是不多的。我们一方面应尽量生产高质量的证据,做当前有条件做的最好研究,促进产生更多的高质量证据;另一方面应当使用当前可得到的最好证据。要做到这点,需要学习和掌握正确识别和使用证据的方法,以上要点可供参考,详细的具体方法建议参加临床流行病学和循证医学的系统培训。