微信直播

NEJM的数据分析比赛,约吗?

Published at: 2015年第1卷第S1期

章仲恒
关键词:

 作者 / 章仲恒,浙江大学医学院附属邵逸夫医院急诊科

 

关于临床研究原始数据的公开问题,目前似乎已经成为一种趋势,站在国家以及政策制定者的角度去看,这确实是个惠及大众的政策:纳税人赞助了一项研究,研究者花数年甚至十几年时间收集了大量的随访数据,并发表文章,但研究者毕竟只是一个团队,出发点和想法都可能存在一定的局限,这时如果邀请全世界的研究者都去参与该数据的挖掘,这就起到了智力众筹的效果,不管是有害的有利的结果都会被报道,临床医生根据这些研究在治疗患者时就会有更好的权衡。这样数据就不会被藏着掖着,白白浪费了大量信息。而且这样可以减少重复的投资,有些临床问题明明可以用之前收集的数据来回答,为什么要花大力气去重新收集一遍数据呢?

刚开始的时候是PLOS one率先呼吁数据共享政策,并且要求投稿的文章都有数据共享声明,而且这些数据是存储在第三方平台的。后来,特别是一些OA杂志也都推出了这项政策,比如有nature出版旗下的Scientific report,BMJ旗下的BMJ open等。这之后我就注意到NEJM和JAMA等几大杂志都反复发表评论文章,要求数据公开,于是大家也都认为,这是个趋势所在。

最近新英格兰医学杂志(NEJM)举办了一次别开生面的数据分析比赛,这对我而言还是头一回听说。这次比赛采用了发表在NEJM上面的一项重要研究叫SPRINT作为数据来源,参赛者通过申请可以获得全部患者的原始数据,然后进行二次数据分析。二次分析并不是该研究的简单重复,而是需要研究者提出一个全新的亟待解决的临床问题。比如某RCT研究了他汀类药物对ARDS患者的疗效,而研究者同时记录了激素的使用情况,那二次分析就可以探讨激素对ARDS的作用,因为激素在使用跟未使用组之间没用随机化进行匹配,这就需要我们采用一些统计方法加以校正,比如倾向性评分,还有各种复杂的回归模型。数据分析的精髓在于如何使用恰当的方法去弥补研究设计上的不足,统计越是复杂的研究说明其设计不足越为突出,而设计良好的研究只需要最简单的统计方法。本次比赛的评分标准包括:分析结果对临床实践的影响(30%)、idea的原创性和新颖性(30%),数据分析方法的科学合理性(30%)、以及大众网评(10%),比赛结果分一、二、三等奖,获胜者获得不菲的奖金以及参加明年4月份在波士顿举办的数据共享大会。但参赛说明里没有说,这些分析结果是否能在NEJM发表。

谈到这个比赛就必须谈到一个网站叫BioLINCC(biologic specimen and data repository information coordinating center),该网站专门用来存放 NIH赞助的临床研究的原始数据,用户可以通过该网站进行申请获得临床研究的原始数据以及各种标本。本次比赛采用的SPRINT研究的原始数据就存放在这个网站,11月1号以后就开放申请,获得批准的用户就可以从里面下载。当然,这个网站里还存放着无数的其它高质量研究,并且都是免费开放给公众做研究的,可以说,这是一个取之不尽用之不竭的数据宝藏,信息共享的魅力在于,用户越多,它的价值也就越大。

NEJM这次以比赛的形式推动数据共享的进程,必须点赞,至少走出了实质性的一步。在比赛规则里他们也说了这是一次尝试,不知道以后是不是要做成一个有特色的系列,就像他们的招牌栏目《麻省总医院病例报告》那样。

doi: 

10.3978/kysj.2014.1.2281
comments powered by Disqus

附件