微信直播

AME循证杂谈007|随机对照试验的批判性阅读

Published at: 2015年第1卷第S1期

周支瑞
关键词:

一、引子

古人云:尽信书不如无书!阅读临床研究的报告更是如此,如果各位看官读过笔者的上一篇循证杂谈文章:《随机对照试验中那些真假难辨的亚组分析》,可能对于这句古语的理解会深刻一点。“尽信书不如无书”事实上是一种批判性阅读的精神。那么问题来了,如何进行临床研究的批判性阅读?对于有繁重工作压力的临床医生来说,如何快速准确的把握一篇临床研究报告的精髓?本文将给大家介绍一种简便实用的随机对照临床试验的批判性阅读方法。首先声明,本文概括的是十一个批判性阅读问题,非本人原创,笔者这次只是个搬运工,把来自于网站http://www.casp-uk.net的批判性阅读材料进行了翻译、总结和解释,尽可能原汁原味又不失可读性,尽可能让这些看起来复杂的概念通俗化。

总体上说,我们阅读一篇临床研究报告,一般会关切三个大方面:临床研究是否可靠、结果是什么、结论是否能为我所用,分别从临床研究的方法学设计、结果效应量的大小与精确度、证据的适用性三个角度去评价一篇临床研究。当然笔者是从绝大多数的证据使用者的立场出发思考这个问题,如果读者一定要较真,那么这三大方面也并非完美无瑕的。当然如果读者您还未曾考虑过这三大方面的问题,那么请认真读完本文。接下来笔者将就这三大关切共计十一个问题逐一进行阐述,以飤读者。

二、临床研究报告的可靠性

NO.1 该研究是否定义了明确的临床问题?

解释:这个问题可以按照循证医学PICOS的原则去解构,P:患者,明确的临床疾病或者症状,一个好的临床研究应该避免把两种类似的症状或者两种类似的疾病混为一谈;I:干预措施,干预措施应该明确可重复,避免出现在一个干预组里不同的患者接受的干预措施不同;C:与试验组的干预措施相对应的比较干预措施,比较干预措施也应该明确可重复,避免出现同一个组里不同的患者接受不同的干预措施的现象;O:结局指标,定义准确,方便测量,便于横向比较;S:试验设计类型,在这里我们讨论的是随机对照试验。图1是一个随机对照试验设计的模式图,便于大家理解本文。

图 1随机对照试验设计模式图

NO.2 研究对象是否随机分配到各干预组?

解释:这个问题包含两层含义,第一层:随机序列的产生是否正确,或者说随机化的方法是否正确?正确的随机化要保证研究对象有均等的机会分配到试验组与对照组。概念看起来有点让人费解,但是读者至少应该了解以下的随机化的方法是正确的:随机数字表、计算机随机数字发生器、掷硬币、洗扑克、投骰子、抽签、最小随机化。图2展示了一种简单化的随机化方法。需要注意的是:按照出生日期或住院日期的奇偶数是一种假随机的方法,而按照临床医生的主观判断、受试者意愿决定分配、检验或检查结果分组、干预措施的有效性分组则是完全错误的随机化方法。第二层含义:即便随机序列产生正确,如果没有科学的隐蔽分组措施保证随机序列正确进行分配,那么结果也会很糟糕。 隐蔽分组的核心要义是:分配过程中研究对象和研究人员不能预测或者预先知道具体的分配方案。比如,研究对象A即将被分配到实验组还是对照组,A本人及研究人员无法预测。

图2 简单随机化的一种方法——掷骰子

NO.3 结论是否对所有的入组对象都进行了合理的解释?

解释:这个问题的字面意思比较晦涩,其实这个问题也包含两层意思,第一层意思:研究是否有不适当的终止?比如某研究由于试验组副反应过大或者试验组事件发生率较常规治疗明显增加等因素而提前终止试验。第二层意思可以近似理解为减员或者失访造成的偏倚,随机化之后是否有大量的患者失访?实验组与对照组失访患者比例是否平衡等。理想化状态下,一个研究应该按照既定的研究方案进行研究,并完成对所有患者的完整随访,直至研究完全结束。实际情况是失访不可避免的,但即使发生失访,如果失访是下述的情况看起来也并不严重,比如:试验组与对照组失访的比例与原因应该大致类似,总的失访率应该控制在10%以内,没有超过20%,数据分析时采用ITT分析的方法,从统计方法上避免失访可能带来的潜在影响。当然与之相反的情况则会比较糟糕,可能引入较大偏倚。

NO.4 是否对患者、医务人员、研究人员实施了合适的盲法?

解释:这个问题探讨了临床研究中盲法的三个对象。严格说来,我们不能笼统的说单盲、双盲或者三盲,而要具体的介绍对哪类对象实施了盲法。图3展示了双盲的模式。对三类对象都实施盲法无疑是最完美的,实际情况是有些情况下实施盲法并不可行,比如外科手术中就不太可能做到对术者本人实施盲法,莫非做手术的人不知道自己将要做何种手术?这显然是荒唐的。我们在判断有无盲法是否会对结果造成影响时,应该考虑到盲法的可实施性,如果盲法无法实施,也应该理解为虽没有盲法但不会对结果造成影响。同时对于一些很客观的结局指标,比如肿瘤研究中有关生存和死亡的结局,对于类似这样的结局,是否有盲法不太可能对结果造成太大的影响。当然对于一些即将用于临床的新药,如果没有合适的盲法,安慰剂效应可能会引入偏倚。

图3 双盲法示意图

NO.5 研究开始时各组的基线特征是否类似?

解释:随机化的价值就在于把临床研究中除试验因素以外的其他因素在试验组与对照组之间进行平衡,当然这是以一定样本量为基础的。假设某研究试验组和对照组在患者的疾病分期上不平衡,实验组的患者分期较早,而对照组的患者分期较晚。随访一段时间后,我们发现试验组的预后要明显优于对照组,那么此时如果下结论认为:试验组的干预措施优于对照组,差异有统计学意义。如此就大错特错了,试验组良好的预后完全有可能是因为其入组的患者多是病情较轻的患者所致,而与治疗药物的效应无关,新药可能完全没用。这个例子可以很好的证明非试验因素在各干预组间的平衡是多么的重要。

NO.6 除了待研究的干预措施之外,其他非试验性的干预措施在各干预组之间是否均衡?

解释:这一条也可以参照上一条理解,我们还是举一个实例来阐述这个问题。试验组和对照组随机化与隐蔽分组都做得很完美,但是在试验实施的过程中,研究者为了试验组取得更好的疗效,无论主观上还是客观上,研究者都有一种心理希望这种新的干预措施能取得较好的疗效,那么此时对于试验组的这些研究对象可能给予更多的关注与更优质的医疗服务,比如对实验组的患者给予了更高规格和标准的护理,那么这种优质的护理措施可能对于改善预后是有帮助的,这样的研究结果可能被过分夸大了,由于除了试验因素以外还混杂了其他干预措施。

三、研究结果如何?

NO.7 该研究的效应量是不是很大?

解释:这个问题应该包含三层含义:第一,测量了那些结局指标?第二,首要的结局指标是什么?第三,其他结局指标的结果如何?除此之外就这个为题本身来说还应包括效应量确切的数值的大小,相对于对照组来说,如果风险比或者均数差越大,那么说明实验组的的干预效果越明显,我们对于这种强阳性的结果越有信心。

NO.8 效应量的估计值是否精确?

解释:效应量精确度由两个因素决定,一个是样本量大小,一个是目标事件发生率的大小。精确度可以通过可信区间的宽度来体现,可信区间越窄精确度越好,可信区间越宽,精确度越差。对于相对指标,比如风险比(OR),一般来说95%可信区间的上限与下限之差不超过0.25就是一个具有良好精确度的研究,当然这只是一个经验性判断方法,可以通过样本量估算,检验效能的计算去定量判断一个研究的精确度是否足够。这些繁琐复杂的统计学方法显然不太合适繁忙的临床医生,也许记住这个0.25也是一个不错的选择。

四、证据的外部适用性

NO.9 研究中的证据是否可以应用于你的病人?

解释:这是在探讨证据的外部适用性的问题。由于随机对照试验过于严格的纳入排除标准,理论上说如此得出的证据应该仅适用于与试验中入组的病人完全相同的病人,而这种理想化的情况是很难达到的,患者与患者之间总是存在个体差异,在高加索人种中开展的研究直接应用于蒙古人种也可能存在这样或者那样的问题。这是随机对照试验自身无法克服的一个局限。多数时候我们仅仅是考虑已知的与试验病人主要特征相似的因素,其他关乎人种、个体差异等并未考虑,当然未来也许随着方法的进步可能也会考虑,毕竟这些因素可能也很重要。

NO.10 是否报告了所有临床中认为重要的结局指标?

解释:这条事实上在探讨一个选择性报告的问题。假设一个研究的研究方案我们可获得,研究方案中计划报告的结局在最后发表的文章中都进行了报告,那么我们可以认为这个研究不存在选择性报告的问题。但事实上,多数情况下我们并不能获得这个研究的研究计划,这个时候如果这个研究报告了所有应该报道的结果,比如一个新药治疗某肿瘤的随机对照试验,研究者报告了总生存率,无进展生存率,远处转移,局部复发,毒副反应,生活质量等,这些指标是全面衡量一个药物临床价值的指标,如果这些指标都报告了,那我们也同样可以理解为研究者不存在选择性报告的嫌疑。作为读者要高度警惕那些研究方案中没有声明要报告的结局被大篇幅报告了,那些本该报告的结局却被遗漏了,这些情况可能存在选择性报告的嫌疑。

NO.11 利弊是否平衡?

解释:循证决策是:“慎重、准确和明智地应用当前所能获得的最好的研究证据,同时结合医生的个人专业技能和多年临床经验,考虑病人的价值和愿望,将三者完美地结合后制定出病人的治疗措施”。可见除了证据本身,患者的价值观,经济条件等等因素都是循证决策的依据。对于一个严格信奉某种宗教,拒绝任何有创检查或者手术的患者来说,对其实施手术显然是不合适的。对于一个家庭经济困难的患者,对其实施有效但昂贵的治疗也是不合适的。所以对于临床研究证据,在循证医学实践中依然要根据患者的实际,权衡利弊来做出决策。

五、结语

以上是关于随机对照试验批判性阅读的十一个问题,下面介绍一下经验性的判断原则:有四个以上的问题答案为否,那么使用这个研究的证据时就应该谨慎;除此之外需要注意的是:第1或第2个问题,只要有一个答案为否,不论其他问题的答案如何,在使用这个证据的时候都应该格外谨慎。

声明:以上判断原则的解释完全来自于笔者对于随机对照试验的理解,未经权威求正,欢迎拍砖。另外文中图片来源于互联网,图片非本人原创。希望本文对各位读者有所启发。

笔者| 周支瑞,复旦大学肿瘤医院放疗科在读博士。AME学术沙龙委员,喜读书,广交友。业余时间担任丁香园循证医学讨论版版主,自学临床流行病学与循证医学五年余。主要研究方向:恶性肿瘤放射治疗与放射生物学研究、循证医学与Meta分析方法学研究。目前以第一作者及共同作者发表SCI论文十余篇,参编学术著作两部。

本文由科研时间首发,媒体转载请注明出处。

点击链接,查看06篇:随机对照试验中那些真假难辨的亚组分析:http://kysj.amegroups.com/articles/1656

Doi:10.3978/kysj.2014.1.432

comments powered by Disqus

附件