微信直播

回顾性诊断准确性研究的设计思路:以阿尔茨海默病标志物筛检为例

Published at: 2015年第1卷第S1期

余抒
关键词:

前言

开始写这篇文章之前,简单介绍我的个人经历:我是2005级的硕士研究生,2008级博士,2011年博士毕业后就卸甲归田过上了居家小女人的生活。两年过后也就是2013年底突然觉得不能再这样没有人生目标的混下去,毕竟孩子已经1岁了,即便不能有大的成就但要给孩子树立一个积极向上的母亲形象,于是我踏上了重返科研的征程,进入了某大学的临床医学博士后流动站。

当一切重新开始以后,发现恍如隔世,尽管只离开了两年半,科研的飞速发展已经不是我从前认识的模样,学弟学妹们高效的产出也是我这个学姐从前无法企及的。所以,博士后研究的初期令我很迷茫,一方面过去一直从事关于免疫调控机制的基础医学研究,不论从研究策略还是具体实施方案上跟临床研究都有本质区别,想要短时间突破已经形成的固有思维定式非常困难;另一方面像我这样的资深老学姐跨界涉足临床研究相当于一切从零开始,也和刚踏进科研之门的研一学生差不多,没有研究方向,没有研究基础做铺垫,没有研究团队可以支撑,相当于“三无”,耳机里单曲循环的《山丘》反复提醒我这些都是将要面对的现实。但好胜心和巨大的出站压力又驱使我不能放弃,于是我如大海捞针一样的阅读各种渠道的文献(科学快报、简讯、论著、综述),并在NoteExpress上对文献按照研究领域分类整理,挑选出有代表性的、各领域的名师之作打印出来精读,对好的idea和好的句子做好笔记和标注,希望从中找到临床研究的灵感和脉络。

事实上通过海量阅读可以积累阅历和开阔思路,在阅读JAMA的科学快报时发现,2013年4月美国提出“脑科学计划”,同时引起了欧盟、日本以及中国在内的科学界强烈反响。随着人口老龄化时代的临近,“脑科学计划”作为二十一世纪的朝阳产业具有十分重要的战略意义。脑科学研究正在蓬勃积极的孕育和发展,阿尔茨海默病(Alzheimer’s disease,AD)、帕金森等神经退行性疾病将成为突破大脑认知、探索神经系统奥秘的重要研究方向。联想到前不久在神经病学论坛听取的《阿尔茨海默病研究进展》学术报告,报告讲到AD属于不可逆性神经退行性疾病,目前无有效的治疗措施。这让我对AD研究产生了浓厚兴趣,早期诊断是否有助于预防控制,结合自己的检验专业做AD的诊断学研究是一个不错的想法,但还需要查找AD诊断领域的文献证实这一想法的可行性。找到研究热点只是开端,研究如何开展,仍需要寻找适合自己的科研思路,形成一个完整的研究脉络。

如何开展回顾性诊断准确性试验

临床研究的方法可以是回顾性的也可以是前瞻性的、或者流行病学调查,相对其它两种研究方法回顾性研究实验设计相对简单、样本量并不苛求、时效性好,只要拥有第一手的临床资料就可以发表文章。作为一个涉足AD研究的初学者,想要“短平快”的实现文章产出,唯有依靠回顾性病例对照研究。但做过临床的人都知道“No data, No paper”,临床资料是开展回顾性研究的前提和基本要素,脑子里迅速想到了之前作报告的王教授。我拜读了他的科研团队在国际知名期刊发表的关于AD防治以及病理机制等方面的论著,发现他们主要研究的方向在AD早期治疗和预防上,与我初步设想的AD诊断性研究不冲突,而且还有可能通过研究互补寻找到合作的可能。于是我向导师汇报了自己的想法,通过导师的帮助,我和王教授进行了第一次的见面和详谈,最终得到教授的鼎力支持和帮助,王教授从自己珍贵样本里分出1/2给到我,我非常感激和感动。拿到如是珍宝的第一桶金(每个样本只有100ul),需要缜密的实验设计和规范的实验操作才能物尽其用,将其发挥的淋漓尽致。

作为没有接受过系统临床研究培训的研究者,设计临床课题最简单粗暴的办法就是“照葫芦画瓢”,所以大量阅读文献是有效果的,挑选出经典的案例,特别是相关领域专家在顶级杂志发表的研究型论著或综述,仔细研读,总结出哪些问题已经解决,采用什么方法解决,方法之间的优劣,还有哪些问题尚待解决,同时结合自己的实验条件提出具有创新性的、可行性的实验思路。通过阅读文献发现,早期诊断AD已经成为本领域的研究目标和热点之一,从2013年开始逐渐由脑脊液的检测转移到血液,因为血液检测无创、简便、更符合早期甚至超早期的诊断要求。但同时也发现,血源性的AD候选标志物过多(初步统计有100多个),且已发表的文章报道的曲线下面积(AUC)基本在0.7左右,分析原因可能与样本纳入排除不够严格、入选的标志物与疾病本身相关性不够、入选的标志物之间相关性不够好等因素有关。

如何提高标志物的灵敏度和特异性,也就是提高诊断性能,我有自己的见解。我曾经做过多年系统性机制研究,比较关注关于疾病的发病机制和参与整个疾病过程的关键致病因子之间相互作用关系。从我的角度理解,AD是一种多因素疾病,唯有在疾病早期发挥关键作用的因子才可能作为有力的候选标志物,纳入到筛选体系;另一方面我认为蛋白质是机体功能活动的执行者,在疾病过程中最终发挥重要作用的是功能性蛋白质而不是Micro RNA或DNA,找到早期的分子作用机制再找到受其调控的下游蛋白,将蛋白作为研究目标纳入诊断性候选标志物是我研究的主要方向。为此我研读了近十年有关AD机制研究的综述,对已经报道的候选标志物和参与致病的还未作为标志物的蛋白逐一分析上下游调控关系,整理了关键作用因子并绘制出上游和下游的作用网络,同时在String数据库(一个可以分析蛋白相互作用关系的在线服务器)反复验证,采用Cytoscape软件对纳入分析体系的候选标志物进行二次筛选,我能够通过这样的分析了解蛋白与疾病、蛋白之间的相互关系。这样在我手上就形成了一个与AD密切相关的蛋白作用网络,我可以根据疾病的进程对功能蛋白进行分类,也可以根据蛋白质在疾病中参与通路不同(如代谢、炎症、免疫调节)进行分类,形成了一个可以随时提取的标志物数据库。

回顾性研究的基本套路就是采集病例、随访、建立研究队列、进行单因素或多因素分析,诊断性回顾研究侧重于分析潜在标志物(风险因素)与疾病发生的关联性,通过差异显著性分析找到与临床结果显著关联的因素,进行回归或建模分析得出诊断性能评价,形成研究的脉络。现在有了样本库(当然这个数据库还不成规模,为了进一步扩大样本量,为开展后续实验提供支撑,我模仿王教授团队建立样本库的方式,自己也开始在医院收集AD的样本和病历资料),建立了候选标志物的数据库(属于自己摸索的一种标志物筛选方式),如何结合现有临床数据的特点展开诊断性研究是接下来需要考虑的问题。

如何运用临床资源成为发表SCI的“敲门砖”

近年来,国内外发表的回顾性研究论文层出不穷,但是文章质量却参差不齐,如何应用优质的临床资源,通过合理的统计学分析,结合研究方案探索疾病的规律是回顾性论文能够脱颖而出的关键所在。所谓“众人拾柴火焰高”,随着前期工作渐入佳境,我也认识了我的合作伙伴,一个非常有才华的师弟,我发表的回顾性诊断研究论文的并列作者,在数据统计、分析处理上有深厚的功底。所以非常感激在科研道路上遇到的良师益友,让我的奋斗不那么孤独,现将我们在整理数据以及文章撰写过程中的一些经验如下:

1、规避研究缺陷:回顾性研究存在数据质量可控性差,资料累积过程中易产生偏倚等缺陷,但可以通过制定严格的纳入排除标准、结合资料类型进行精细分组等方式对资料存在的先天缺陷进行后天弥补。例如:我们对基线资料整理时,我们设立的第一篇文章的队列是无并发症的AD和无任何疾病症状的正常对照(这样的病例样本量虽偏少,但是有创新性的),除了AD的纳入采用国际认可的标准外还要具体描述纳入的样本中临床智能评估、影像学检查等结果,同时将排除标准细化到具体疾病,包括慢性感染、肾病、高血压、肿瘤、血管性痴呆以及其他非AD的认知功能障碍等。

2、统计学处理合理、严谨:回顾性研究最重要的就是统计方法的运用得当和数据分析的严谨合理。有了第一篇文章的经验积累,在处理第二篇文章数据时不会过于盲目。第二篇文章涉及312例样本,33个检测因子,相当于每一例样本对应33个检测数据,涉及数据庞大需要进行建模处理。然而数据类型不同建模方法不同,得到的模型结果也不同,根据数据特点我们选择采用Logistic 回归和随机森林两种方法建模,然而仅通过比较AUC及CI角度无法明确优劣,需要多次抽样(随机抽取1000次70%的数据为训练集,剩下的30%数据为测试集建模),将得到的AUC曲线叠加,发现两种建模方法(除模型选择不同外,其他参数和样本集选择方式均相同),随机森林的AUC更加收敛,预测结果优于Logistic回归。在样本量>100的队列分析中,随机森林是一种能够在高维数据中有效分析具有交互作用或非线性关系的数据的方法。因此,通过多参数对比选择随机森林作为回顾性队列大样本研究的建模方法更优。

3、讨论客观精准:讨论是整篇文章的精髓和精神指引,讨论要有层次并且思路清晰,由一条主线贯穿,同时多条辅线辅佐和丰满内容。在文章撰写阶段曾遇到无法进行下去的情况,比如发现了类似的文章已经发表、发现数据的结果与预期相矛盾等,都不用太紧张,因为找到与已发表文章的不同点可以增加自己文章的可阅读性,发现数据与预期相悖可能与分析方法不当或者数据本身存在的问题有关,找到并解决此类问题,加入讨论的描述中反而为文章添彩。在准备撰写第一篇文章时,一篇刊登在JAD(Journal of Alzheimer’s disease)杂志上的研究 1(http://refhub.elsevier.com/S0009-8981(15)30087-5/rf0010)让我有了紧迫感,文章发现了AD发病初期的血液性标志物,可以说取得AD的体液诊断性研究的重要突破。然而,这样的的发现对我的文章发表增加了难度。原因有两点:1)同为血液诊断,文章做了早期病例对照研究,结果发现了系列预测性的标志物,而我的文章只体现了确诊AD的病例对照研究,并没有早期病例;2)文章采用的统计方法也与自己相似,没有优势可言。可是,反复阅读文章发现其主要的目的是阐述脂代谢异常可能会在AD发病早期起到重要的作用,而与我的文章寻找血源性的诊断标志物不同。所以,找到的类似文章的研究目的有助于更深刻地诠释自己的文章,让自己的文章论点和论据更加充分。

我的研究论文简介

任何文章都不是一气呵成、一触而就的,都是在不断的摸索中精雕细琢,最后呈现出完整的故事。我的两篇文章接收均较顺利,2015年9月投Clinica Chimica Acta杂志,12月4号修回,12月14日接受,17日可在线查阅 2;2017年2月21日投Molecular Neurobiology杂志,5月10日接收,6月1日可在线查阅 3。周期都比较短,我认为还是跟前期文章的准备(包括数据深度分析、反复验证、杂志选择、编辑喜好的研究、以及存在问题的处理)等诸多细节密不可分。

讲了那么多,接下来简单介绍一下我所发表两篇回顾性文章的主要内容。第一篇是关于新标志物筛选的,目的是找出未见报道的与AD致病机制密切相关的早期诊断性标志物,为研发血源性诊断标志物提供有力的数据参考。研究设计的巧妙之处在于,队列采用的排除相关并发症的AD患者和年龄、性别匹配的正常对照,这样设计的原因是想发现与AD早期发病密切相关的标志物。文章首次将VEGF和sCD40L联合应用于血清诊断AD的实验研究中,确定了一种基于血清的筛选AD候选标志物的方法,得到的候选标志物可能成为新的兼具诊断和治疗的双向靶标。第二篇文章则从样本库中随机抽取156例AD病人血清样本,按照1:1匹配原则匹配156例正常对照,样本检测采用 Luminex xMAP 高效液相芯片技术,将前期建立的标志物数据库根据荧光信号强弱判断蛋白表达差异,得到了立体多维的数据。应用数学建模的方法进行数据采集和分层挖掘,最后确定随机森林算法作为文章的多维参数建模方法,得到以8个血清蛋白标志物为基础的诊断模型,且8个标志物与简易精神状态检查表(Mini-Mental State Examination,MMSE)表现良好的相关性,模型诊断的曲线下面积可达0.98,可以为AD的外周血早期、主动性诊断提供理论依据,应用该方法得到的结果可在后续研究中进行大规模临床验证,以期找到新的、有效的、可用于临床的AD检测手段。

任何研究都存在设计上的缺陷或数据分析的不足,比如样本含量偏少、缺乏临床验证、缺乏轻度认知功能障碍(Mild Cognitive Impairment,MCI)、血管性痴呆、帕金森和AD的鉴别诊断、缺少长期随访数据、存在潜在的选择性偏倚等等,都需要在后续的研究中通过扩大样本数据库、开展临床多中心研究、深入社区跟进采样和随访等多种渠道和途径逐步解决。


文章撰写的几点建议

经历两篇回顾性文章的撰写、投稿、回复审稿意见,下面谈谈几点体会供大家参考。如何借鉴他山之玉来理清思路,首先明确几个问题,如何将结果组织成完整的故事,换句话讲就是如何将文章的逻辑性层层推进?文章的论点论据是否充分,创新性是否足以打动审稿人?如何保证文章的结论具有说服力? 

1、投稿有诀窍:在国际期刊上投稿也需要窍门和技巧,投稿前要对研究领域的杂志做系统性的比较和分析,了解期刊的喜好,以及每年收录文章的数量,结合自己文章的特点有的放矢,减少时间和精力的无畏浪费。

2、文章的创新性:创新的关键是与以往发表文章的不同之处、或者本研究弥补了以往研究存在的哪些缺陷或不足,如增加样本量、增加待测因子数量、提高检测灵敏度等。将重要的信息放在句尾或者段落尾部,从熟悉的信息开始阐述,以创新型的信息结束,既满足读者习惯,又达到层次清晰、平滑过渡的效果。

3、写好cover letter的重要性:cover letter就像敲门砖,代表文章的门面,在语言表达上需要谦和且全面,既体现文章的梗概又要有吸引编辑的亮点。如果有必要,建议在cover letter中加一句General Interests,例如文章是讲诊断建模的,就可以加一句本研究成果不光在该疾病的研究中有意义,研究思路和建模体系在其它类型疾病诊断中也开辟了新思路等。

4、回复修改意见:最好的对策是,问题问什么答什么。当然也分两个层面,一是小修,说明文章没有什么硬伤,而且编辑对文章的印象分也不错(通过编辑的回信可以分析出),那么回复时只需要注意逐一解答问题就可以了;其二是大修,文章修改意见较多,好的回复可以让编辑重新审视文章,为文章接收加分,但是切记不能带有情绪,比如觉得评审没有认真评审,或者没有看到你的内容,对于此类回复需要客观,不能有自我偏向,用科学依据去争辩或者采用演绎推理来为自己的文章加分。

以上便是我作为神经内科学领域的外行对阿尔茨海默病回顾性研究所发表两篇小文章的概况,有些观点可能不一定准确还请谅解。总而言之,在科研道路上,没有任何一件事是劳而无获的,只要用心去付出,即便走过弯路但都会成为以后进步的财富。有句话送给大家“科研没有雪中送炭,只有锦上添花”,越努力就会越有收获,不论是笨鸟还是菜鸟,只要愿意付出总有一天会成功展翅飞翔。


[参考文献]:

  1. Khemka, V. K. et al. Altered serum levels of adipokines and insulin in probable Alzheimer's disease. J Alzheimers Dis 41, 525-533, doi:10.3233/JAD-140006 (2014).

  2. Yu, S. et al. Diagnostic utility of VEGF and soluble CD40L levels in serum of Alzheimer's patients. Clin Chim Acta 453, 154-159, doi:10.1016/j.cca.2015.12.018 (2016).

  3. Yu, S. et al. Serum Protein-Based Profiles as Novel Biomarkers for the Diagnosis of Alzheimer's Disease. Mol Neurobiol, doi:10.1007/s12035-017-0609-0 (2017).


此文为《临床研究经典案例解析》作者招募活动投稿文章

作者:余抒 空军军医大学口腔医学院检验科

学术审核:胡志德 AME Publishing Company 

责任编辑:宋纪松 AME Publishing Company 

排版编辑:陈媛玲 AME Publishing Company 

comments powered by Disqus

附件