微信直播

ChART数据库的深度挖掘——以点带面

Published at: 2015年第1卷第S1期

冷雪峰
关键词:

无论是常见肿瘤还是相对罕见肿瘤,数据库的建立和完善对于研究者或研究组在相关疾病进一步研究和探索来说,无异于取之不尽用之不竭的瑰宝。许多科研新手或没有接触过数据库的临床科研人员感觉“高大上”的数据库遥不可及。数据库的建立既可以基于临床医生个人,也可以基于科室、医院层面。当然,在学会、学组、协会、甚至国家层面建立的数据库更具有权威性。而且在更高层面建立的数据库质量控制更优,各种偏倚相对更小,做出的研究结果可信度更高。对该疾病在诊断、治疗和深入认识上将会提供更多的贡献。

本文为了向读者展示如何利用数据库寻找科学研究出发点,科学的选用研究方法并撰写论文进行发表,笔者选取一篇借助ChART(Chinese Alliance of Research for Thymomas,中国胸腺肿瘤协作组)数据库,其协作组发表在Journal of Thoracic Disease的代表作为例,探讨如何利用数据库进行科研选题和深度挖掘。

一、ChART数据库简介

胸腺肿瘤是胸部实体肿瘤中相对罕见的一个类型,目前所有胸腺肿瘤均已被视作恶性肿瘤。目前可用的临床指南一般是根据专家意见或单中心回顾性研究的结果而制订的。因此,当前亟需推动和加强全球性或区域性的协作,以改变当前的局面。国际胸腺肿瘤协作组织(International Thymic Malignancy Interest Group, ITMIG)成立于2010年,致力于胸腺恶性肿瘤的研究、教育和对患者提供支持。全球已有数以百计的成员加入了该组织。为积极响应ITMIG的号召,中国胸腺肿瘤协作组(Chinese Alliance of Research for Thymomas, ChART)于 2012年成立。在来自14个省、直辖市的18所三级诊疗中心的大力支持下,ChART已成功建立了首个全国性的胸腺恶性肿瘤数据库。该数据库迄今已收录了1994年-至今诊治的超过3,000例胸腺肿瘤。

值得一提的是,ChART回顾性数据库采用中心管理,并非开源数据库。贡献数据的单位提出研究课题申请经学术委员会讨论通过即可获得相应部分的数据。回顾性数据库与ITMIG全球数据库同源,是基于电子表格的数据的粗狂式汇总,不包含影像资料,但其中ChART的质量在三大洲里是最好的。随着对研究需求的扩大,AME协助并一起建立了前瞻性数据库。前瞻性数据库目前正在筹划建立影像和病理库(图1)。

图1. ChART前瞻性数据库操作界面

二、研究背景及简介

作为一个数据库的建立初衷,和通过这个数据库进一步研究疾病的目的到底是什么?ChART数据库给了我们很好的诠释。胸腔镜手术作为胸外科微创领域具有革命性的术式,较开胸手术具有诸多优势。然而,作为纵隔疾病的胸腺肿瘤来说,传统观念上正中开胸和后外侧开胸似乎可以更加清楚的暴露和完整切除病变。对于临床早期(I期和II期)的胸腺肿瘤,随着胸腔镜技术的发展和普及,到底采用胸腔镜还是开胸手术治疗效果更好?尤其是在患者长期预后方面并无共识和统一的规范。本文筛选的代表性研究就是通过这个悬而未决的Point展开数据库层面的回顾性分析(http://dx.doi.org/10.21037/jtd.2016.03.05),从而给出合理的答案。

该研究回顾性分析了1994年至2012年期间ChART数据库中共1,117例临床早期(Masaoka-Koga分期I和II期)的胸腺瘤手术患者。纳入和排除标准的制订是准确进行下一步数据筛选的基础。该研究的纳入标准选择了胸腺瘤临床早期术前未进行任何治疗的手术患者;排除标准则为没有接受手术治疗或接受了术前辅助治疗的患者。当然,一定要说明缺失数据的患者需要被剔除,如没有组织学、分期或者手术方式等数据记录。在这些患者中进一步筛选出采用胸腔镜手术241例,开放手术876例。

在数据库中有了基本数据资料的采集后,难倒众神或者成为路障的可能就是统计学方法的选择了。在这种回顾性分析中涉及不同术式对比、生存时间影响的研究,其统计学方法的选择自然也是有套路可寻的。以该研究为例,连续变量采用t检验,分类资料采用卡方检验或Fisher精确检验,使用Kaplan-Meier方法和Log-rank检验制作生存曲线,采用Cox比例风险模型进行长期生存独立预测因素的多因素分析。经过这一整套SPSS软件下的操作则可以得出研究的核心数据。值得一提的是,除了常见临床基本资料和术式对比的统计学分析外,作者还巧妙的将这种时间跨度较大的数据进行了随时间趋势变化的展示(图2,3),让读者对研究的理解和结果的解读在印象上更加深刻 [1]

图2. 开胸手术与VATS组1994年至2012年数量的变化趋势

图3. VATS胸腺切除手术从2004年至2012年所占比例的变化趋势

通过对上述研究的简单剖析,可能对数据库回顾性分析的思路多少有了一些眉目。但这并不是本文的重点!单凭迸发出的一项思路对数据库进行分析后也许会得出指导临床的研究结果,但真正要发挥出单病种,尤其是单个肿瘤疾病数据库的最大功效得依靠一系列的研究,找出现在临床上还存在争议、未达成共识、或需要更新观念的point,并系统的给出答案,这样才有可能得到认可,达成专家共识,甚至形成国内或国际水平的指南。说了一通高大上的理念,但对于刚开展临床研究工作者们来说,还是需要实实在在接地气,举一反三才行。

三、数据库的深度挖掘

在这部分内容中,将向读者展示数据库的协作单位成员的研究者们如何边研究边发现问题,并将其进行更深一步的研究。

首先,接着上述研究说事儿。对临床早期(Masaoka-Koga分期I和II期)胸腺瘤的手术患者探寻胸腔镜还是开胸手术孰优孰劣的问题已经得出了“推荐胸腔镜手术在早期胸腺瘤患者中应用”的结论。但是“早期”毕竟涵盖了I期和II期,那么更进一步针对I期患者是不是也会有令人期盼的结果呢?而且,在回顾性研究中,由于种种原因其数据库录入来自多中心,存在数据偏差和混杂变量较多,也会对研究结果造成一定影响(同理,各种数据库的录入在质量控制上多少也会存在相关偏倚和混杂因素)。为了消除这个问题,该研究团队选择了倾向评分匹配的统计学方法来减少这些偏差和混杂变量的影响,进一步对I期胸腺瘤胸腔镜组和开胸手术组进行更合理的比较。最终该研究结果摘要在2017年第25届欧洲胸外科医师协会年会崭露头角,专家对统计学方法设计的严谨性给出了好评。作为读者来说,有了这个启示,是不是再来一个II期患者的相关研究也不是不无可能?

其次,从一个胸外科疾病本身的角度来考虑,胸腺瘤就涵盖了术前的影像学诊断、病理学的获得、早期肿瘤的手术治疗、局部晚期的术前诱导治疗、术后辅助化学治疗、放射治疗,以及无法手术患者的姑息治疗等等。针对这么多的问题,该数据库协作组成员一一把它们搞清楚,自然义不容辞。就这样,基于ChART数据库的胸腺瘤诊疗专刊在Journal of Thoracic Disease杂志应运而生(http://jtd.amegroups.com/issue/view/174)。这个系列的研究定是在集思广益下不断完善数据库的挖掘和研究所产生,所以团队的力量很重要,一个人的点子毕竟是有局限性的。

1. 术前影像学诊断

目前为止,普遍和行之有效的胸腺瘤术前检查仍是CT。但是CT影像学与胸腺瘤相关的研究较少,在该文发表前仅有一项回顾性研究探讨了CT影像学表现与可切除胸腺瘤之间的关系。另外,行了新辅助治疗的患者也被纳入了这项研究,从而可能会影响到其研究结果。作者很好的抓住了这个研究点,排除了经过术前辅助治疗的患者,再进一步探讨和补充CT影像学特征在胸腺瘤的临床分期和可手术切除评估上的潜在作用。

该研究纳入数据库2010年4月到2011年11月期间连续手术治疗的胸腺上皮肿瘤患者共138人。在术后基于Masaoka-Koga分期进一步分析了CT影像学特征下肿瘤分期与手术完全切除之间的关系。结果提示,手术病理学分期中I期63人,II期32人,III期32人,IV期11人。术前CT影像学分期与术后病理学分期高度吻合。在单因素分析中,肿瘤形状,轮廓,瘤内密度,强化形式以及侵犯邻近组织结构与原发肿瘤完整切除相关(P<0.05)。但是在多因素Logistic 回归分析中仅有未发生动脉系统侵犯作为肿瘤完全切除的预测指标(P<0.05)。研究结论得出通过CT影像学特征可以很准确的对胸腺瘤进行评估。影像学无肿瘤的动脉系统侵犯是作为胸腺瘤完整切除的唯一预测特征 [2]

2. 治疗前组织病理学诊断

无论何种肿瘤性疾病,治疗前明确组织病理学诊断尤为重要。对于早期肿瘤来说,手术治疗首当其冲,但对于进展期病灶,只有获得病理学依据方可指导下一步治疗。ChART数据库研究人员再次抓住缺乏大样本数据的研究作为支点,将数据库中进展期患者的病理学数据进行回顾性研究,探寻术前组织学活检诊断在治疗模式和预后方面的影响,从而为今后临床研究和实践提供有帮助的信息。

该研究回顾了1994年至2012年12月期间在治疗前行活检的患者,进一步分析了术前组织学诊断在治疗预后方面的影响。1,902名患者中,术前行活检的有336(17.1%)名。在近十年期间术前组织学诊断的比例明显增高(P=0.008)。采用胸腔镜/纵隔镜/E-BUS进行活检较开胸活检明显要多(P=0.029)。术前进行活检患者的病变分期更晚并且恶性程度更高(P=0.000),自然相比没有活检的患者来说,完全切除率要更低(P=0.000),生存时间也更短(P=0.000)。研究结论指出,通过微创活检的方式在术前或辅助治疗前对胸腺瘤获取组织学诊断非常重要 [3]

3. 局部晚期病灶的术前诱导治疗

对于局部晚期的病灶,手术治疗充满挑战。即使在一些报道中可以采用扩大切除或者上腔静脉重建,但仍存在争议。术前诱导治疗过去也有尝试,但毕竟局限在小样本量。对于胸腺瘤这个疾病来说,只从单中心给出的数据很难给出确切的结论。作者正是抓住了这点亟待解决和存在争议的问题,对ChART数据库中局部晚期行诱导治疗的患者展开了回顾性研究。

研究从数据库回顾了1994年至2012年间接受了术前诱导治疗的患者,并与术前评估后直接手术的患者进行了对比分析。接受诱导治疗的患者均是局部晚期(III-IV期),当病理分期降至I和II期则认为诱导治疗降期有效。为了更准确的研究诱导治疗的效果,本研究将IV期患者予以排除。只有I-III期的诱导治疗患者和III期的直接手术患者入组进行进一步亚组分析和对比。在1.713名患者中只有68(4%)名接受了诱导治疗,R0切除率67.6%,5年复发率44.9%,5年和10年生存率分别为49.7%和19.9%。其中17例(25%)患者诱导治疗后达到了降期效果。胸腺瘤的降期比例高于胸腺癌(38.7% vs. 13.9%, P=0.02),降期后的5年生存率也要更高(93.8%vs. 35.6%, P=0.013)。排除IV期患者后,5年的总生存率在手术组为85.2%,诱导治疗组68.1%(P=0.000),R0切除率相当。当诱导治疗有效后其5年生存率(93.8%)与直接手术组(85.2%)接近,但都比降期失败的患者5年生存率(35.6%)要高。最终结论指出,术前新辅助治疗仅偶尔在局部晚期病灶中使用。对于潜在无法切除的病灶,尤其在胸腺瘤当中,有效的诱导治疗可以使肿瘤降期并给患者带来益处 [4]

4. 术后辅助放射治疗的选择

回顾文献发现,对于胸腺瘤术后放疗仍然存在争议。既然存在争议,那么就有进一步研究的价值。为了寻找突破口,协作组研究人员发现现今多主张病理IV期患者需行术后放射治疗,以便控制局部复发。但对于I-III期患者术后是否需要行辅助放射治疗则很难下定论。那么,研究组就从这个点开始,探讨I-III期患者肿瘤完全切除和不完全切除,术后辅助放射治疗的差异。

该研究搜索了数据库中1994年至2012年间I-III期没有新辅助治疗手术切除的胸腺瘤患者。使用单因素和多因素生存分析方法,Cox比例风险模型来确定死亡的风险比。共有1,546名I-III期患者纳入研究。649名患者接受了术后辅助放射治疗。这部分患者经过单因素分析后,在进一步多因素分析中均显示组织学类型,Masaoka-Koga分期以及是否完整切除肿瘤在OS和DFS中均为独立的预后因素。随之亚组分析显示肿瘤未完全切除的患者接受术后辅助放疗可以达到更好的OS和DFS(分别为P=0.010, 0.017),然而,肿瘤完全切除的患者接受术后辅助放疗反倒会降低OS和DFS(均为P<0.001)。最终得出结论建议I-III期肿瘤不完全切除术后患者行放射治疗可以提高OS及DFS,而对于可以完全切除肿瘤的患者来说,术后辅助放疗并不能使患者获益 [5]

5. 术后辅助化学治疗的选择

众所周知,肿瘤的综合治疗离不开化学治疗在术前、术后的应用。对于胸腺瘤来说,伴有远处转移的患者可采用姑息性化学治疗。但对于III-IV期的患者使用辅助化疗是否获益仍然未知并存在争议。该研究组在是否开展术后辅助化疗这个争议点上进行了回顾性分析。

将1994年至2012年间1,700名未接受新辅助治疗的手术患者纳入研究。665人为III-IV期,进一步分析和评估这些患者在术后化疗的疗效。采用Kaplan-Meier法划分不同亚组获得生存曲线,Cox回归分析对影响预后的因素进行多因素分析。倾向匹配研究来评估化疗的临床意义。研究结果提示221名患者接受了术后化疗,接受术后化疗患者的5年和10年DFS及复发率分别为51%和30%,46%和68%;没有术后接受化疗的患者为73%和58%,26%和40%。经过倾向匹配研究后,158名配对共316名患者,5年生存率在两组间基本相似(P=0.332)。最终得出结论,III-IV期患者术后辅助化疗并没有证据表明可以带来获益 [6]

6. 伴有合并症患者的预后

“合并症”这个概念在临床研究中可以涉及很多内容。对于胸腺瘤来说,最常见的就是重症肌无力。直到现在仍不清楚重症肌无力是如何影响胸腺瘤患者预后的,所以回顾性分析研究单纯某一个或几个“合并症”(这里指重症肌无力)对该疾病预后的关系也可成就一篇美文。

此项研究的目的是对比是否合并重症肌无力(MG)的胸腺瘤在其术后的生存差异。研究组纳入了数据库来自18个中心自1992年到2012年的数据。对临床资料进行回顾,随访患者并分期其生存状态。结果显示研究涵盖了1,850名患者,421名合并重症肌无力,1,429人无合并症。合并MG的患者胸腺完全切除率为91.2%,而无MG的一组完全切除率为71.0%(P<0.05)。在MG组中组织学类型更多见AB,B1或B2型(P<0.05),分期多为I和II期。5年和10年的OS率在MG组均较高(93% vs. 88%; 83% vs. 81%, P=0.034)。最后得出结论,虽然经过分析MG并不是独立的预后因素,胸腺瘤患者如果合并MG,尤其是在分期较晚的患者,其生存时间要更长。可能的原因是这部分患者可能由于有临床症状,更容易早期发现肿瘤,而且组织学类型更好,具有更高的R0切除率和更少的复发率 [7]

7. 挑战权威,引领未来

当数据库的数据足够大时,第一可以验证现有国际通行的标准是否适用于国内患者的病情和治疗策略制定,其次就是可以通过相对完善的数据信息和令人信服的研究方法改写适合于国人的指南。Masaoka-Koga分期系统是应用最普遍的胸腺瘤分期方法,但由于其诸多局限性越来越引起专家对其更新的思考。在ITMIG和IASLC的联合下推出了TNM分期,ChART协作组为了进一步了解不同分期系统的预测效力,回顾性分析对比了这两个分期系统,结果对未来临床实践和科学研究极为重要。

协作组回顾性分析了ChART数据库中1992年至2012年间2,370名患者的数据。其中1,198名患者具有完善的TNM分期,Masaoka-Koga分期,以及可用于生存分析的数据。主要对累积复发率(CIR)和总生存时间(OS)在Masaoka-Koga分期基础上进行分析。然后使用新的TNM分期与之进行对比。最终通过结果得出结论,与Masaoka-Koga分期相比,LASLC/ITMIG的TNM分期不仅描述了肿瘤侵犯的范围,而且在淋巴结受累和肿瘤转移上也提供了信息。指导了未来的研究中应用前瞻性记录的TNM分期信息可以帮助更好的对胸腺肿瘤进行分类,从而判断预后和指导临床实践 [8]

四、总结

对于临床医学研究者,任何新的研究计划都应该站在巨人的肩膀上,建立在前人工作的基础之上开展。而数据库带来的便捷则是,坐拥一台电脑,不用跑到病案室耗时翻阅就可以回顾总结和写出一篇SCI论文。在数据挖掘上既要有Idea的见缝插针,又要基于系统的回顾现有证据,这样才能有的放矢,避免研究的浪费。针对初学者来说,可借鉴(图3)作为研究开展的思路。望借助ChART数据库已经开展的一部分回顾性研究展开简要分析,对临床工作者起到触类旁通,并对接下来的科学研究工作有所帮助。

图3. 研究问题和IDEA的思路

参考文献

  1. Wang H, Gu Z, Ding J, et al.Members of the Chinese Alliance for Research in Thymomas. Perioperativeoutcomes and long-term survival in clinically early-stage thymic malignancies:video-assisted thoracoscopic thymectomy versus open approaches. J Thorac Dis2016;8(4):673-679.

  2. Shen Y, Gu Z, Ye J, et al. CTstaging and preoperative assessment of resectability for thymic epithelialtumors. J Thorac Dis 2016;8(4):646-655.

  3. Yue J, Gu Z, Yu Z, et al.Members of the Chinese Alliance for Research in Thymomas. Pretreatment biopsyfor histological diagnosis and induction therapy in thymic tumors. J Thorac Dis2016;8(4):656-664.

  4. Wei Y, Gu Z, Shen Y, et al.Members of the Chinese Alliance for Research in Thymomas. Preoperativeinduction therapy for locally advanced thymic tumors: a retrospective analysisusing the ChART database. J Thorac Dis 2016;8(4):665-672.

  5. Liu Q, Gu Z, Yang F, et al. Membersof the Chinese Alliance for Research in Thymomas. The role of postoperativeradiotherapy for stage I/II/III thymic tumor—results of the ChART retrospectivedatabase. J Thorac Dis 2016;8(4):687-695.

  6. Ma K, Gu Z, Han Y, et al. Membersof the Chinese Alliance for Research in Thymomas. The application ofpostoperative chemotherapy in thymic tumors and its prognostic effect. J ThoracDis 2016;8(4):696-704.

  7. Wang F, Pang L, Fu J, et al.Members of the Chinese Alliance for Research in Thymomas. Postoperativesurvival for patients with thymoma complicating myasthenia gravis—preliminaryretrospective results of the ChART database. J Thorac Dis 2016;8(4):711-717.

  8. Liang G, Gu Z, Li Y, et al. Membersof the Chinese Alliance for Research in Thymomas. Comparison of theMasaoka-Koga staging and the International Association for the Study of LungCancer/the International Thymic Malignancies Interest Group proposal for theTNM staging systems based on the Chinese Alliance for Research in Thymomasretrospective database. J Thorac Dis 2016;8(4):727-737.

致谢:衷心感谢上海市胸科医院方文涛教授悉心指导。

作者简介

冷雪峰,主治医师,在读博士,成都大学附属医院胸外科。现担任成都市胸外科质控中心秘书,成都市康复医学会肺康复专委会委员,AME学术沙龙委员,学术记者;国际肺癌研究协会(IASLC)会员,国际食管疾病协会(ISDE)会员,国际食管疾病协会中国分会(CSDE)会员。担任Annals of Translational MedicineVideo-AssistedThoracic Surgery杂志Section Editor;《临床与病理杂志》中青年编委及审稿专家。从事胸部疾病基础和临床研究,发表多篇国内外学术论著,参与编译专著4部,获省级科学技术进步奖三等奖及适宜技术推广奖一等奖。

此文为《临床研究经典案例解析》作者招募活动投稿文章。

comments powered by Disqus

附件