微信直播

REMAP:RCT与大数据的完美融合

Published at: 2015年第1卷第S1期

章仲恒
关键词:

文|章仲恒,金华中心医院 ICU

 

JAMA 上常有令人脑动大开的文章,而 NEJM 则太过完美庄严,让人觉得无懈可击。

近日一期的 JAMA 上出现了一个称之为 REMAP 的研究类型,其英文全称为"randomized, embedded, multifactorial, adaptive platform (REMAP) trial"。得到一个新的缩写名字,我们总习惯性地逐字进行分析理解。

首先该研究是随机前瞻性的,这一点无需过多解释。

其次它是嵌入的,嵌入到哪里?嵌入到电子病历系统里,这在理论上没什么新奇,但在实践上确令人耳目一新,也就是说你在做 RCT 的时候不再是拿着一本 CRF 表格在病房里转悠收集数据,而直接的医嘱系统就是你 RCT 的研究平台,某个入组患者所有的化验指标、检查信息都成为了研究的因素,而且这样的嵌入方式可以使你的研究手段就是平日里临床工作的一部分。RCT 的困境之一就是其研究结论的推广是十分缓慢的,有的甚至还来不及推广开去,一种新的研究结论又出现了。比如我们的 EGDT 复苏策略,当我们还努力在实践中规范这项经典的治疗方案,并为取得的成绩沾沾自喜的时候,新的研究告诉我们:其实 EGDT 跟普通治疗没什么差别!这里指的就是 RCT 结果与临床实践之间有一道很大的鸿沟,再怎么努力地进行培训和教育,这道鸿沟都一定存在。但是如果把 RCT 研究直接设计进我们的 his 系统,那结果就不一样了,这时我们是边学边用,始终使患者获得最有价值的治疗。

第三个单词是多因素的,有人说这个在传统 RCT 中已经能很好的解决,随机化的过程就是一个均衡多因素的过程,不管是 1 亿个还是 10 亿个已知和未知的混杂因素,随机之后一律清零,留下的只有干预因素是不同的。那么这里为什么要强调多因素呢?这是因为人类渴望认知,而不希望一些重要的因素被稀里糊涂地随机掉了。况且在多因素的不同水平上,干预效果可能是不同的,而 RCT 所能给出的只是一个平均效应值。我们去看病的时候不希望自己被平均吧?谁不希望能从医生那儿够获得适合自己个体的独一无二的治疗呢?不需要任何理由,因为我们每个个体都是独一无二的。传统的 RCT 因为考虑到经济和人工成本,只能纳入有限的一些变量,但在 REMAP 系统中,研究嵌入进了整个电子病历系统,多因素不再是个问题,大无可大。

第四个单词是适应性的,这属于续贯设计里的一个概念,也就是说 RCT 不是一开始就设计好的,样本量也是不定的,而是摸着石子过河,走一步看一步,纳入一个病人系统就自动分析一下,看看是否疗效显著或者无效。传统的续贯设计往往并不是纳入一个病人就分析一次,而是纳入一定数量病人才分析一次,或者在特定的时间间隔进行分析,这种叫群续贯分析。这样设计之后我们可以根据中间分析的结果调整研究方案。原文中举的例子非常好:随着研究的进行,我们发现有 70% 的可能 A 方法比 B 方法更有效,那么我们的随机设计就可以从原来的 50:50 改成 70:30,这样就会让更多的参与研究的患者获益。同样道理,在研究中如果发现在某个亚组获益程度更高,那么接下来的研究就可以调整不同亚组的干预分配。但让我困惑的是,这样得出最终结果如何进行点估计和距估计呢?因为我们知道续贯设计的抽样分布跟传统那种一锤定音式的 RCT 是不同的,最后的估计是需要调整的。看来脑洞虽大还要有理论支持。

接下来没有单词了,做个总结。大数据的核心是模型的建立和机器学习,里面有我们熟知的回归模型,和我们不熟悉的神经网络模型;但目的只有一个,那就是预测未来。当参数无限增加,我们的预测就会越来越趋向于 100%。而海量的数据处理我们必须要借助计算机,以及比如像R这样优秀的统计平台。而 RCT 最大优势就是以一种痞子的方式来梳理和建立因果关系,用随机化的方法野蛮地把一切混杂因素统统祛除。然而如果我们把 RCT 研究整合到大数据中,后果会怎样?

画面太美不忍直视。

【AME纵横专栏】将不定期转载金华中心医院 ICU 科室章仲恒医生的精彩文章,以飨读者。“纵横”创意源自本栏目主仲恒医生之名,意在“笔意纵横,奔放自如”。想知道本栏目有哪些有趣的文章,章医生如何奇思妙想吗?敬请持续关注!

doi:10.3978/kysj.2014.1.1580

comments powered by Disqus

附件