微信直播

如何利用已有的病历开展回顾性研究:从一篇3.5分的论文谈起

Published at: 2015年第1卷第S1期

胡志德
关键词:

根据数据收集方式,可以将临床研究分为前瞻性数据收集的研究和回顾性数据收集研究。所谓前瞻性数据收集的研究就是指预先制定研究方案,并且根据研究方案收集未来的数据。回顾性数据收集的研究则是指制定研究方案后,回顾性地收集过去的数据。换而言之,二者的区别主要在于到底手机的是将来的数据还是过去的数据。前瞻性数据收集研究的优点是能较好地控制的数据质量,研究的说服力强,缺点是论文产出周期较长,花费较高;回顾性数据收集研究的优点是论文产出周期短,属于典型的“短平快”研究,且花费极低,缺点是数据质量差,难以开展高水平的研究。

对于刚刚开展临床研究,缺乏经费支持的普通医生而言,笔者建议开展回顾性数据收集的研究。这类研究虽然有数据质量差的先天劣势,但是可以通过后天的努力予以弥补,比如:精心的实验设计、巧妙的论文组织等。在此,笔者拟以一篇2015年刊登在Am J Cardiol上的一篇(2015;115:57-61.)回顾性数据收集的研究为例,谈谈如何开展此类研究。

一、研究简介

众所周知,心力衰竭的预后取决于多种因素,有主观干预的因素(比如各种治疗措施),也有客观存在的因素(比如患者的年龄、肾功能等)。对影响心衰预后的因素进行研究,有极其重要的临床价值,因为预后评估在很大程度上会影响治疗方案的选择。在这篇文章发表以前,已有部分零星的研究发现:(1)淋巴细胞降低的心力衰竭患者预后较差;(2)中性粒细胞/淋巴细胞比值(NLR)与多种心血管疾病的预后有关。因此研究者打算去探讨NLR是否与心衰的预后有关。

首先,研究者检索了2007年至2010年期间在医院就诊的心衰患者的病历资料,从病历资料中提取出了患者就诊时的一些检查结果和病史、体征等。包括中性粒细胞计数、白蛋白、电解质、肾功能、服药史、房颤病史、高血压病史、冠心病病史、糖尿病病史等。然后到社保系统中去查询了这些病人截至2012时的生存状况以及心脏移植状况。有了患者就诊时的资料和死亡时间,剩下的事情就是用统计学方法去分析影响患者疾病预后的因素了。

在国际杂志上刊登的这种远期预后研究,套路相当固定:一般都是先按照暴露因素进行分组比较,然后采用Kaplan-Meier生存曲线分析暴露因素与结局事件的关系,最后用Cox风险比例模型探讨暴露因素是否与疾病结局有关。有部分统计学功底较为扎实的作者会继续用c-statistics、NRI和IDI之类的高级统计学方法探讨下暴露因素是否可以提供“额外”的预后信息。本文探讨的暴露因素是NLR,结局事件是全因死亡和心脏移植。其论文结果部分也是按照上述“套路”来展示的:第一部分是患者特征描述(原文表1):首先按照NLR水平将患者分为高中低三组,然后比较各组的临床特征和结局有无差异;第二部分是用Kaplan-Meier生存曲线分析下NLR与疾病结局的关系(原文图2、图3和图4);第三部分是用Cox风险比例模型分析NLR是否与心衰患者的预后独立相关(原文表2和表3)。

需要说明的一点是:在进行数据分析的时候,一定要按照暴露因素(NLR)对患者进行分组,但是具体分几组?分组的界值如何设定?这些问题完全是由研究者主观确定的。一般规律是:如果样本量大,就可以多分多组,但一般不要超过5组;一般是采用均分的方式,比如本研究就是将患者均分为3组;也可以按照国际上公用的客观标准对患者进行分组,比如把患者分为高血糖组、血糖正常组和低血糖组。

二、研究的特色分析以及

从创新性上来讲,这项研究的创新性其实不大。其实在这项研究之前已经有大约4项研究探讨了NLR与心衰患者预后的关系。之所以能刊登在Am J Cardiol上,笔者认为主要有以下几点原因:

第一、本研究设计很严谨。比如作者在论文中专门讲到:2007年至2010年期间共有549名心衰患者在作者所在的医院就诊,其中22例患者因没有NLR结果而被剔除出研究,最终只有527人进行了数据分析。这句话貌似废话,其实不然:预后研究很多时候都是观察性研究,既然是观察性研究,在设计的时候就一定要注意病例来源的代表性,这样才能确保研究结论的外推性。研究者之所以这样撰写论文,主要是为了传递一个信息:一共549个人到医院看病,虽然最终只分析了527人,但是样本的代表性受损并不是很大。当然,如果做得严谨点,还可以比较下进入研究的527人和未进入研究的22人其它临床特征是否有差异,如果没有差异,则更能说明虽然有部分病人没有进入研究,但是样本来源的代表性还是很好的。

第二、统计学处理很严谨。不管是简单的多组比较还是Kaplan-Meier生存曲线、Cox风险比例模型,基本是一气呵成,挑不出任何毛病,完全符合国际惯例。唯一的缺陷是没有用c-statistics、NRI和IDI等统计学方法去论证NLR是否能提供常规指标所不能提供的预后信息。如果作者能够用这些统计学方法证明NLR具有“额外”的预后价值,那这片文章估计还能发在更好的杂志上。当然,也有可能作者已经做了这方面的分析,但是结果是阴性的,因此索性扬长避短地不写了。

第三、论文撰写十分流畅。俗话说,文如其人。很多同行在阅读文献时都反映一个问题,同样一个题材的文字,有的作者写得拖泥带水,读得很费劲。有的作者则言简意赅,简单几句话就把复杂的事情讲清楚了。医学论文总体的写作原则就是:层次清晰,通俗易懂,富有逻辑。如果大家仔细阅读这篇文章,就会发现该文写得十分“简约而不简单”。下面我们以本文讨论部分为例,谈谈作者的写作思路:第一段先用三句话总结研究的主要发现,然后用一个thus进行归纳和总结,帮助即将阅读讨论部分的作者理清思路,为后续的讨论部分做好铺垫;第二段主要是进行扩展,对比相关研究和类似研究,突出本研究的创新点;第三段讲的是本研究的临床价值,也就是NLR作为一个心衰预后标记物有和优势,如何正确理解NLR在心衰预后评估中的价值;第四段总共两句话,解释了本研究观察到的现象与以往的研究有不一致的地方,并进行了解释,这段话其实也可以融入第二段;第五段讲了本研究的局限性。理论上讲,后面可以再放一段话,用2到3句话概括下本研究,但是作者并未这样做,稍许有些遗憾,可能与作者的写作个性有关。但是总体而言,本研究的写作确实很流畅,可读性很强。

三、本研究对我们的启示

病历资料是一个大宝库,虽然病历上的数据都是一些临床常规的指标和治疗方案,但是这并不意味着利用这些资料就无法发表SCI论文。能否利用这些资料发表SCI主要取决于以下几种因素:

第一、idea是否新颖。即便是已经发表过的idea,也有发表的价值,所谓一点之见即可成文。研究的指标或诊治方案不一定要很新颖,但是整体上一定要比以往的研究有所创新。

第二、科研设计和统计学是否科学。比如本研究在开展的时候就十分注意样本来源的代表性问题,详细说明了病例招募过程,旁敲侧击地传递着一个信号:本研究的样本来源具有一定的代表性。统计学处理上一气呵成,基本挑不出毛病。

第三、病历资历尽可能详尽。观察性研究最大的缺陷在于存在很多混杂因素,因此需要采用统计学方法进行校正。如果在采集数据时漏掉了一些关键的数据,则后续的校正就无从谈起,论文的说服力也就大打折扣。从本文的表1我们可以看出,研究者采集了病人的很多信息。有了这些信息,才能开展后续的多元Cox回归分析。

第四、利用病历资料发表论文,构建具有随访信息的数据库是关键。一旦拥有随访信息,并构建数据库,必将会源源不断地产出论文。本文作者已经将549名心衰患者的病历资料进行了整理,其中还包括随访资料。假定作者现在想研究肌钙蛋白与心衰患者预后的关系,完全可以从数据库中筛选出有肌钙蛋白结果的心衰患者,然后采用同样的思路(Kaplan-Meier和Cox模型)分析肌钙蛋白与心衰预后的关系。

总之,回顾性数据收集的研究虽然有一些固有的缺陷,但若辅之以科学严谨的设计,仍然能发表不错的论文。

相关阅读:

comments powered by Disqus

附件