微信直播

同一题材前面已经有四项研究发表了,我还能发表吗?

Published at: 2015年第1卷第S1期

胡志德
关键词:

很多新手在开展临床研究的过程中,总是感觉无从入手。自己辛辛苦苦想了一个idea,一上网检索文献才发现,相似题材早已发表,自己的idea一点都不新颖。临床研究虽然强调新颖,但是这并不意味着相似的题材就无法发表。实际上,如果我们仔细研究学术杂志上发表的临床研究类论文,就会发现有一些研究就属于典型的“炒冷饭”的研究。换句话说,相似的研究早已发表,而且还不止一篇,但同样的研究还是能接二连三地出现在学术杂志上,这是为什么呢?笔者以我们研究组发表在Clin Chem Lab Med上的一篇文章为例(Clin Chem Lab Med 2016;54:e195-197),谈谈如何“炒冷饭”。

一、研究背景简介

既往的研究认为红细胞体积分布宽度(RDW)是一个血液学指标,主要用于贫血病因的鉴别诊断,但是近年来越来越多的研究显示其在心血管疾病、自身免疫性疾病和恶性肿瘤等多种疾病的预后判断中有重要价值。在我们开展研究前,已经有四项研究探讨了RDW在急性胰腺炎患者预后评估中的价值,分别如下:

  • Senol K, Saylam B, Kocaay F, Tez M. Red cell distribution width as a predictor of mortality in acute pancreatitis. Am J Emerg Med 2013;31: 687–9.

  • Cetinkaya E, Senol K, Saylam B, Tez M. Red cell distribution width to platelet ratio: new and promising prognostic marker in acute pancreatitis. World J Gastroenterol 2014;20: 14450–4.

  • Gulen B, Sonmez E, Yaylaci S, Serinken M, Eken C, Dur A, et al. Effect of harmless acute pancreatitis score, red cell distribution width and neutrophil/lymphocyte ratio on the mortality of patients with nontraumatic acute pancreatitis at the emergency department. World J Emerg Med 2015;6: 29–33.

  • Yao J, Lv G. Association between red cell distribution width and acute pancreatitis: a cross-sectional study. Br Med J Open 2014;4: e004721.

我们之前就关注了这些研究,发现他们的实验设计、统计学处理等都有一些共同特点,大致流程就是:先找一些急性胰腺炎患者,然后根据患者是否在院内死亡将其分为死亡组和存活组。接下来比较死亡组和存活组的RDW,发现死亡组的RDW比存活组要高。然后再采用受试者工作特征曲线法(ROC)评价RDW预测患者院内死亡的价值。有的作者会在此基础上加一个logistic回归,分析RDW是否与急性胰腺炎患者的院内死亡独立相关。文章最终都是发表在1-3分的杂志上。我们在阅读完这四篇文章之后就在想:既然前面四篇文章都能发表,那我为什么不能去发第五篇呢?

二、利用MIMIC II数据库研究RDW与急性胰腺炎患者预后的关系

恰逢那段时间我们正在研究MIMIC II数据库,因此就想到了利用MIMIC II数据库去探讨RDW与急性胰腺炎患者的预后。MIMIC II数据库是一个公共开放的重症医学数据库,里面包含了三万多名重症患者的住院信息,包括实验室检查、治疗措施、预后信息等。由于有部分重症患者是因为急性胰腺炎而住院的,因此想到了利用MIMIC II数据库研究RDW与急性胰腺炎患者的预后。MIMIC II数据库主要是通过SQL语言调用数据库中的资料,在此不做赘述。最终,我们在数据库中发现了162个急性胰腺炎患者,其中17人在住院期间死亡。

三、我的研究思路

由于此前已经有四项研究分析了RDW与急性胰腺炎的关系,所以我们的文章必须比此前的文章有所创新,才可能有机会发表。就研究思路而言,很难有大的创新,毕竟ROC和logistic回归的组合已经十分成熟和广为应用,我们不太可能跳出这个套路,只能在细节上做一些改进。数据分析结果显示:(1)院内死亡的急性胰腺炎患者RDW高于院内存活的患者,这与以往的研究结果是一致的;(2)ROC分析结果表明RDW预测急性胰腺炎患者院内死亡的曲线下面积为0.66;(3)多元logistic回归分析结果表明,在校正了SOFA和SAPSI评分后,RDW仍然与急性胰腺炎患者预后有关。得到这些统计学结果后,剩下的事情就是要努力挖掘本研究的创新点,认真撰写论文,把研究的价值、创新点等阐述清楚。

通过对比此前的研究,我们发现此前的研究虽然用了多元logistic回归,但是校正的混杂因素不是很全面,比如只考虑了年龄、肾功能、钙离子、白细胞计数等,但没有研究校正过SOFA评分和SAPSI评分,而这两个评分又是多个指标的组合,十分具有代表性。在观察性研究,校正混杂因素是必不可少的,然而该校正哪些因素、如何校正却是仁者见仁智者见智。总体原则是校正的因素越多越好,至少应该把重要的、公认的因素考虑到。显然,如果有的混杂因素别人并没有校正,但我们校正了,这就是我们的创新点。因此我们在撰写论文前言的时候,就直接写:To present, four studies have reported that RDW was a prognostic index in acute pancreatitis (AP) [6–9], but some of the strong confounders, such as simplified acute physiology score I (SAPSI) and sequential organ failure assessment (SOFA), were not considered in these studies. It remains unknown whether RDW could provide prognostic value independent of SOFA and SAPSI。这是一种论文写作策略:当自己的研究题材不是很新颖时候,一定要尽早地在论文中简明扼要地说出自己的创新点,以便审稿人和读者对该研究产生兴趣。

当然,如果我们的研究创新性仅仅是“多考虑了一些混杂因素”,显然还不够分量。因此还需要去挖掘更深层次的创新性。对比以往的研究后我们发现:以往的研究都认为RDW预测急性胰腺炎患者院内死亡的价值很高,ROC曲线下面积都在0.8以上,但是我们的研究显示RDW预测急性胰腺炎患者院内死亡的曲线下面积仅为0.66。我们认为这是我的另外一个创新,这一结果提示我们:第一,以往的研究可能把RDW的价值夸大了;第二,也有可能是因为我们的研究对象的是在ICU住院的急性胰腺炎患者,而此前的研究纳入的是急性胰腺炎患者,不论其是否在ICU住院。推测我的研究中急性胰腺炎患者的病情较重,因此我们提出:对于病情较重的急性胰腺炎患者,RDW预测院内死亡的价值可能有限。我们在讨论部分对此展开了论述,旁敲侧击地告诉审稿人和读者,这是本研究的另一个创新点。

四、投稿过程的点滴记录

起我们我将论文投给了Clin Chim Acta(影响因子2.8分),但是很快被拒了,审稿人觉得研究没有什么创新。这也可以理解,对研究创新性的认定往往很主观,每个人的标准不一样。然后我们将文章投给了Clin Chem Lab Med(影响因子3.0分),编辑初审后给出的意见是拒稿,但是可以改成letter后重投。因我们将论文改成了letter,重新投给了Clin Chem Lab Med。编辑部很快返回了两个审稿人的意见:第一个审稿人的意见很正面,觉得论文有创新,可以发表,只是有几个单词拼错了,要改正。第二个审稿人比较难对付,他关注的问题主要是在统计学上,最核心的问题是:为什么我们我不去证明RDW可以提供常规指标所不能提供的预后信息?这个问题确实和合理,也很致命,一看就是高手提出来的问题。其实在实验设计之初我们也想去论证这个问题,但是后来发现死亡的急性胰腺炎患者太少了,根本无法展开稍微高级点的统计分析。因此,我们也就跟审稿人实话实说并摊牌:主要是样本量太少,特别是死亡病例较少,所以没办法论证这个问题。

编辑部的意见最终是接受,可能也是考虑到了本研究虽然有瑕疵,但是瑕不掩瑜,总体上还是有价值的。就这样,被2.8分的杂志拒稿,最终被3分的杂志接受。

五、我的体会

第一,关于创新性的认识

医学研究讲究“创新”,也就是审稿人经常在审稿评语中写的“provide additional information”、“extend our knowledge”。每个人对于“创新”一词的理解有所不同。创新可以分为跟踪创新和原始创新,原始创新难度较高,往往需要一定的知识积累和机遇,多数研究者还是在乐此不彼地做着跟踪创新的工作。本研究就是一项典型的跟踪创新,说得通俗点,就是“炒冷饭”。跟踪创新不一定是去探讨一个十分新颖的指标或者一项很前沿的技术,而是对以往的研究进行一些改进。创新可以体现在设计上(比如前瞻性研究和回顾性研究、设盲与否)、体现在统计学处理上(动用了较为高级的统计学方法)、研究对象上(普通患者和重症患者、合并糖尿病的患者和无糖尿病的患者、山东人和上海人),也可以体现在研究结论上:之前的研究显示有效,但我的研究显示无效;之前的研究显示有关联,但是我的研究并不支持这一观点。

对于“炒冷饭”的研究,研究者一定要注意的问题是:(1)千万不要通过回避相关研究的方式来凸显自己研究的创新性。国外的审稿人都会进行文献检索,一旦发现作者刻意回避了一些研究,拒稿几乎在所难免;(2)要通过对比以往的研究,挖掘自己的创新点,并想法设法在论文中进行凸显。比如我们在论文的前言部分,就开门见山地说:既往有四项研究探讨了这个问题,但是都存在一些缺陷。言外之意,本研究就是来改进这些缺陷的。其实,对于“炒冷饭”的研究,论文写作十分重要,特别是要不动声色、扬长避短地凸显研究的新颖性和重要性。

第二、关于公共开放数据库

数据是临床研究核心,如何获取高质量的数据是关键。很多同行感叹自己势单力薄,缺乏行政资源,无法收集到质量较高的数据。若放在十年以前,数据收集确实是和老大难的问题。但是在如今这个信息共享的时代,数据收集显然不应该成为临床研究的瓶颈。其实网上有很多公共开放的数据,只需要申请者提交一定的材料就能进行使用。这些数据库的样本量往往很大,病历资料十分详细,适合开展不同类型的研究。比如笔者所使用的MIMIC数据库就是一个包含了近五万例患者的重症医学数据库,里面包含了每个患者的实验室检查结果、治疗措施、预后信息等。相似的数据库还有著名的SEER数据库,该数据库主要包含了肿瘤病人的发病率和生存状况等,很多基于SEER数据库的文章都发表在高水平的杂志上。当然,还有一些其它数据库,读者可以自行挖掘。这些数据库的出现,实际上就是一个数据共享的范例。当前,国际上关于数据共享的呼声越来越高,很多经典的临床研究都在逐步开放自己的数据。对于我们而言,通过不断阅读文献来开阔自己的视野,提升自己的科研能力才是关键。同时应该不断学习这些数据库的构建特点,摸索数据的提取方法,为自己将来开展临床研究奠定坚实的基础。笔者坚信,未来的临床研究,只要有心,数据俯拾皆是。

六、总结

即便此前已经有相似研究发表了,自己也能继续发表,前提是自己凝练出了自己的研究的创新性,并在论文中巧妙地进行了阐述。临床研究的对象是病人,既然是病人就会存在很多变数,因此学界一直鼓励研究者对同一个问题反复进行论证。换句话说,临床研究鼓励百家争鸣。

哦,对了,第六项关于RDW与急性胰腺炎预后的研究也在最近发表了。

相关阅读:

comments powered by Disqus

附件