微信直播

AME循证杂谈006|随机对照试验中那些真假难辨的亚组分析

Published at: 2015年第1卷第S1期

周支瑞
关键词:

一、引子

本文将从两则故事说起……

第一个故事就是鼎鼎有名的羟乙基淀粉事件。2013年3月,临川医学四大期刊之一的BMJ杂志刊登了一篇有关德国Ludwigshafen大学医学院Joachim Boldt叫兽的文章,这可不是什么歌功颂德的好文章,而是一篇彻底粉碎Boldt虚构的羟乙基淀粉神话并彻底揭露造假者嘴脸的檄文,文章的题目是:《Boldt: the great pretender》(Blodt:伟大的造假者)。事情的来龙去脉是酱紫的:Boldt于2009年在《Anesthesia and Analgesia》杂志上发表了一篇文章,这个研究在心脏外科手术患者中对比了白蛋白与羟乙基淀粉两种体外循环液对术后炎性因子与脏器功能的影响。文中报道的结果表明羟乙基淀粉以无与伦比的华丽数据打败了白蛋白。由于羟乙基淀粉的效果实在是太好了,价格又比白蛋白便宜很多很多很多,这简直就是上帝对人类的“恩赐”!于是乎很多读者求Boldt大神赐教,并对文中的问题做出解释,Boldt对此的反应是:不予回应!后来Anesthesia and Analgesia杂志主编也迫于读者的压力要求Boldt本人出面做出回应,Boldt本人仍然是岿然不动:坚决不予回应!事件的发展最终惹毛了Boldt所在医学院的地区医学会,医学会启动相关调查程序并于几个月后发布了详尽的调查报告:Boldt 的研究并未经任何伦理委员会批准,没有与患者签订任何知情同意书……更让人大跌眼镜的是医院体外循环组的负责人说他们医院已经很多年未使用过白蛋白了。白蛋白的生产商也说从未给Boldt所在医院配送过白蛋白。进一步的调查表明:Boldt本人超过90 篇(看官请注意,不是1篇,也不是9篇,是整整90篇!)羟乙基淀粉临床研究完全是闭门造车的产物(这才是论文造假界的大腕,可谓前无古人)!研究者们在剔除了Boldt等人的研究后对相关羟乙基淀粉的文章重新做了meta分析,发现羟乙基淀粉效果并未优于晶体,并且发现其所致病死率和肾脏损伤发生率却明显增加。而同等作用的平衡盐溶液的价格仅仅是羟乙基淀粉的十分之一左右,羟乙基淀粉从此被打下神坛。这样一个由Boldt亲手编造的神话故事和科幻小说就以这样不光彩的结局收场了。

第二个故事是关于Cochrane协作组、BMJ杂志社与罗氏公司生产的 Tamiflu-达菲(奥司他韦,1999 年在瑞士上市,2002 年被批准在中国上市)之间的长达十年的纠葛——真是剪不断,理还乱!达菲是一种全世界范围内广泛使用的流感病毒神经氨酸酶(neuraminidase)抑制剂,无疑是因为罗氏公司在相关的临床试验的报告中声称达菲能治疗感冒并有效减少并发症。2005年Cochrane Group发表了Jefferson和其他研究员对奥司他韦进行系统评价的研究报告:奥司他韦只能减少流感的持续时间不到 1 天,不过可以减少病毒的传播以及次级并发症,主要是下呼吸道感染。奥司他韦在无症状的流感中效果不佳。此文一出,舆论哗然,支持者有之,质疑者亦有之。为了能够进一步证明自己的结论,这个系统评价制作小组开始了历时弥久的向罗氏公司要求获得达菲临床试验原始数据的艰难过程。BMJ因此也发起了“达菲运动”要求药厂公开全部临床试验数据。关于达菲的争论目前还在继续,这也许将是一个永远没有答案的悬案!

二、亚组分析可能存在的危害

说了这么多,好像与主题无关,实则不然!笔者想要表达的意思全都蕴含在这两则故事里,由于种种原因,临床研究的证据有时可能并不真实甚至是完全错误的,作为证据的使用者需要慧眼识珠,从而在临床实践中高效和安全的使用证据!本文将从随机对照试验中亚组分析结果的解读切入,借大家一双批判性阅读的火眼金睛!

研究者对亚组分析总是抱有热情,不明就里的读者对此也表现出了很大的乐趣,但是那些没有预先规定、不加选择的亚组分析会带来很多问题。而这种泛滥的亚组分析在医学研究中却很常见。比如在一些随机对照试验的结果报告中,我们经常看到这样的情况,试验组的干预措施较对照组在所有入组的研究对象中并未发现有任何优势,统计学没有显著性差异,然而在研究者的几次亚组分析后,奇迹出现了,试验组的干预措施在某些亚组人群(比如某种基因突变、某个种族、某个组织类型、某个医院的患者、某个年龄段等等)的人群中拥有了神奇的效果。这样一个来源于数据挖掘(亚组分析)的结果拯救了一个原本可能毫无价值的新药。然而事实果真如此吗?

三、亚组分析结果不可靠的统计学解释

在随机对照试验中,研究对象在正确的随机化与隐蔽分组之后,实验组与对照组在除试验因素以外的其他因素方面达到了均衡,这是随机化最重要的作用,换句话说实验组与对照组的基线特征是平衡的。此时如果我们在所有研究对象水平得到实验组优于对照组,那么我们有理由认为实验组确实是优于对照组,这种阳性结果确实来源于实验组与对照组干预措施不同造成的真实差异,而不是由于“机遇”,一种偶然因素造成了这种差异。下面我们举一个非常极端的例子,假设研究者按照患者的星座或者属相把研究对象分成了12个组,最后研究者发现在处女座或者属相是猴子的这部分人中,实验组疗效明显优于对照组,于是研究者在最后的研究报告中下了这样一个结论:我们的新药在属猴子的这部分人中有非常好的疗效,p﹤0.001。研究结果很完美!研究者可能还据此在临床指南中做出了这样的推荐:这种新药在属猴子的人中必须推荐使用,证据级别为IA类。如果话这么说,看官可能觉得可笑,甚至是荒唐!而就是这样荒唐可笑的事情也时常出现在四大临床医学期刊上。下面我们举一个看起来更“正经”的例子。假设某耗资20亿美元研发的天价靶向药物在总体人群中并未发现较传统化疗药物有任何优势,作为等待大赚一笔的药企、作为迫不及待扬名立万的研究者来说这实在是很难承担的结局。谁能忍心20亿美元就这样打水漂?这不是20亿日元,也不是20亿越南盾,这是货真价实的20亿美刀!oh,my god! 那真是比“割肉”还要难受啊!肿么办?这时候统计学砖家勇敢的站出来了,大声说:好办,看我72变!请把该病相关的基因突变分子全都检测一遍,我们按照基因突变情况分一分亚组:A突变是阴性结果换B突变,B突变还是阴性结果就换C突变,C突变依然是阴性结果就换D突变……如此一直更换到Z突变,终于发现该靶向药物在Z突变的这群人中有神奇的疗效,简直就是王母娘娘的仙丹,有起死回生之功效!看官此处可以认真思考一下,这个看似“正经”的例子与按照属相分组的例子有何区别?这不过是一个“假正经”的例子,两个例子所反映的本质是一样的。

上述做法欠妥的本质原因就在于亚组分析事实上已经破坏了随机化的原则,亚组内的研究对象在基线特征上可能已经不再平衡了,此时亚组分析的结果的证据级别最多与一个观察性研究的证据级别类似,大多数时候其可靠性不如一个设计合理且基线特征平衡的观察性研究结果。请各位看官注意,笔者并没有武断的认为所有亚组分析都是破坏随机化原则的,都是不合理的。举一个例子说明这个问题,事实上我们也看到很多顶级医学杂志发表的严谨的临床试验报告,这种试验常常多见于研究者发起的临床试验,研究者会在研究方案中就明确申明会按照什么重要的临床因素进行亚组分析,在试验设计与实施阶段,研究者还会按照这些事先规定的重要的临床因素进行分层随机化,以确保这些因素在实验组与对照组之间的均衡,那么如此得到的亚组分析的结果可以理解为来自于一个随机化分组之后的结果,只是这个结果的样本量小于预估计的样本量,因为亚组仅仅是总体的一部分而已。当然这种做法在统计学上仍然不是完美无瑕的,还存在一个多重比较的问题。假设此时研究者按照事先规定的三个因素进行了亚组分析,研究者势必会在每个亚组内部进行统计检验,以观察在亚组人群中实验组与对照组的统计学差异,对多个亚组及多个终点事件的复合分析会使统计检验的次数显著增加,检验次数增加之后相应的假阳性的概率就会增加。所以这种情况下即便在某个亚组分析中得到阳性的结果,可能是一种“假阳性”,统计学上的“障眼法”!

事实上亚组分析的结果多数时候只能作为一个未来研究的启示,不能作为临床决策的依据,如果对于亚组分析阳性结果确有兴趣,那么需要重新设计“head to head”的随机对照试验进行验证。比如发现了某种靶向药物在某A基因突变的人群中有显著作用,那么需要入组一批有这个基因突变的患者,然后进行随机分组,一组接受靶向药物治疗,一组接受标准化疗。在这样所有患者都具有A基因突变的人群中如果得到靶向药物优于标准化疗,这样的证据才是令人信服的,这样的证据才可以推广到临床使用。

四、对于亚组分析读者应该注意的问题

虽然笔者尽可能避免使用复杂的统计学术语,尽量选择那些有趣的实例,但是此处读者可能还会觉得理解起来吃力,不过没有关系,牢记以下原则即可:

1.亚组分析不是洪水猛兽,可以有,但是要预先确定,少而精(笔者认为不应多于5个,虽然笔者不能拿出确切的证据证明5个就一定好于6个,总之越少越好),亚组的确定有理有据。如果一个随机对照研究事先按照亚组的分组因素进行了分层随机化,那么后续的亚组分析的结果要可靠许多,虽然可能存在多重比较的问题;

2.亚组分析结果的证据级别应该理解为一种类似于观察性研究的结果,原因在于,大多数的亚组分析破坏了原始研究的随机化;

3.对于那些总体人群结果为阴性的随机对照试验,在不满足第1条的情况下却进行多次未加选择的亚组分析,对于这样的研究结果要持坚定的怀疑态度;

4.对于那些来自于药厂发起的或者药厂赞助的临床研究,作为证据使用者要持有更加谨慎的态度;

5.任何临床证据都是有局限性的,怀有医者的崇高使命感,批判性对待所有临床证据,谨慎使用临床证据,如此才能无愧于良心。

五、结语

行医不易,除了要懂医术,还要看得懂兵法,各位读者且行且珍惜!

声明:敝文第2、3部分所举案例,纯属笔者虚构,如有雷同实属巧合,所举案例也不针对任何对象,纯属学术探讨,欢迎拍砖!

笔者| 周支瑞,复旦大学肿瘤医院放疗科在读博士。AME学术沙龙委员,喜读书,广交友。业余时间担任丁香园循证医学讨论版版主,自学临床流行病学与循证医学五年余。主要研究方向:恶性肿瘤放射治疗与放射生物学研究、循证医学与Meta分析方法学研究。目前以第一作者及共同作者发表SCI论文十余篇,参编学术著作两部。

本文题图来自网络。本文由科研时间首发,媒体转载请注明出处。

点击链接,查看05篇:什么样的文章是一篇好文章。http://kysj.amegroups.com/articles/1508

DOI:10.3978/kysj.2014.1.417

comments powered by Disqus

附件