微信直播

科研论文里的“拿来主义”

Published at: 2015年第1卷第S1期

韩东升
关键词:

温馨提示:全文篇幅较长,阅读时长约需12mins.

作者简介

韩东升,男,主管技师,医学硕士。1986年出生,2013年毕业于温州医科大学,临床检验诊断学专业。现就职于江苏省苏北人民医院医学检验科,科教秘书。

目前主要从事临床检验及部分基础研究工作。在分子水平开展腹泻致病菌的检测和微进化分析。兴趣点包括耐药监测、病原学及传染病流行病学研究等。目前主持国家级、市级自然科学基金共2项。在国内外期刊上以第一或通讯作者发表论文10余篇。现为江苏省免疫学会“医学免疫与转化医学专业委员会”感染与检验学组委员。国际同行评议期刊Medicine、McrobiologyOpen等杂志的审稿人,学术期刊Journal of Laboratory and Precision Medicine的 Section Editor.

前言

想不出更好的题目,也许只有从万人敬仰的鲁大师(当然人家本姓周)文中撸来这个“拿来主义”,才能切实描述我毕业三年多来对科研的坚持是何等单调,甚至自感有些无聊。道上的规矩大家都懂,有数据的是爷,有完美数据的是大爷,有完美大数据的是老爷。而我,一个必须专心于临床常规工作的资深老技工,又身处一个团队缺如、实验难开、自有数据匮乏的环境里,唯一能在大家面前显摆的就是不分昼夜在线人肉上述各位爷的大作、招牌作,然后做万般跪舔和膜拜状,最后狼吞虎咽般消化掉与自己专业和方向相关的内容,以示自己对科研这个东西旧情难忘。

事实上是,读多了想法也就多了,自然会产生写自己东西的冲动。没数据,不怨天地,不怨爹娘,更不怨自己,境遇如此,我又奈何。自弃会浇灭一切美好想法的火种。其实本就无需灰心,前进路上总会有各种套路救我们于水火,之一就是“拿来主义”。此处的“拿来”,即通过检索他人研究结果,提炼挑选原始数据,进一步整合、优化和分析,化为已有成果的过程。我就是一个执著本分、踏实践行“拿来”条款的人。通过设定一个合理的想法(Idea),然后检索(Searching)文献或数据库、挑选(Selecting)数据、重分析(Re-analysis)数据,看似非常俗套的路子,却已被我奉为延续科研生涯最重要的作业逻辑!无它,全是为了保住三无背景下心中的那团科研火焰!

身为一个资历尚浅的硕士毕业生,我讲不出高深大道,道不明机制机理,也给不了扎实的逻辑阐述,谨藉此机会从个人两段经历出发,对自己的“拿来主义”做全盘供述,献给处于同样境遇的科研斗士,权当交流,请挑拣使用,带入歧途概不负责!

一、硕士阶段萌生“拿来”思想

讲“拿来主义”,在拿之前,首先要有一个“拿”的理由,也就是要事先找到一个合适的想法或思路!这里我将想法的层次定位为“合适”,而非“好”或“优秀”,因为我感觉这更符合一般硕士及以下学历人的实际,刚开始做研究或者身受平台及个人条件限制的,执拗于去寻找一个同时具备创新性和可行性的思路是比较艰难的。尤其对像我这样一穷二白,依靠在各种文献和共享数据(库)里以乞讨二手数据度日的拿来主义者,更没有任何好高骛远的理由,必须冷静思考,量身打作一个与自身条件相匹配的想法和思路,弄明白自己到底能干什么?多少东西可以为我所用?通过什么途径能干的漂亮?

阅读文献永远是科研人最有效抓取想法的途径,科研人请不要对此有任何质疑。我人生第一篇论文的想法和构思就是在无任何前期基础之上从文献中直接“拿来”的。说起这篇文章,就要介绍一下我硕士阶段最初的科研经历,2011年初我作为联合培养生被导师派往国家CDC疾病预防控制处参与国家传染病重大专项“传染病检测技术平台”项目管理工作,一个临床检验专业做感染免疫研究(导师课题组的一个方向)的硕士生,复加之预防领域的熏陶,专业方向自然而然的也就沾染了传染病流行病学的气息,虽然到现在本人的流行病学理论仍在基层晃荡,但一年半的委培时间里学到的东西,着实为我如今及以后的发展方向和思路拓展奠定了基石。也就是在这段委培期间,我完成了人生的第一篇科研论文,也是个人的第一篇SCI。

记得是在一次常规工作会议上,指导老师突然提出要我写论文练级,自己先找思路、一个月后汇报。写论文于我是多新鲜个事啊,人生第一回啊!就一个月时间,蒙圈就蒙了一个多星期,到底写啥?咋写呢?由于那段时间我做的是腹泻症候群病原监测工作,任务使然,脑子里首先浮现的肯定是细菌性腹泻、病毒性腹泻、急性腹泻等主题词。而当时我认为相对于细菌性腹泻,病毒性腹泻似乎更具有临床和流行病学监测意义,观点是细菌性腹泻有药可治,而且发病率可以随生活条件和环境卫生的提高而降低,而致腹泻病毒无法常规在临床实验室培养,且多无药物治疗,所以探求腹泻病毒的传播与分布规律似乎对疾病的预防和疫苗的开发更具指导意义。于是就决定以病毒性腹泻为切入点,先通过各大数据库检索文献探探路,结果发现诸如“某某国家/地区某某时间段轮状病毒监测结果分析”、“某某地区诺如病毒流行病学分析”等千篇一律的单病原流行病学研究铺天盖地。毋需置疑,如果我再照章弄出个“某某地区轮状病毒或/和其它病毒监测结果分析”之类的东西肯定没意思,指导老师也不会同意!单病原的想法也就此放弃。

于是继续对收集来的150多篇文献集中分析,发现有20篇左右是对多病原体监测结果同时分析的。这就有点意思了,不用随大流了,更重要的是我们传染病检测技术平台的哨点医院本身就肩挑着同时检测急性腹泻病人标本中的五种常见急性腹泻病毒(轮状、诺如、扎如、星状和肠道病毒)的任务。所有哨点医院相应的传染病相关病原检测数据及收集的病例和标本信息都要录入到检测技术平台的信息系统内,就像全国耐药监测网一样,只有哨点单位和国家管理机构才有权限导出和利用上传的数据,因为我们这个传染病重大专项项目是以五年计划持续滚动实施的,所以分布在全国的哨点医院很多,我估计会有不少跟我一样的人有权限使用自己区域的检测数据。我随即从检测平台数据库导出各子课题组上报的数据,发现老板课题组积累的腹泻病例数和毒株已大有规模。总算有点眉目了,想法和现状有点匹配了,最起码当时国内多病原监测研究还没被流水般报道。

那么如何下手呢?难道还是像多数研究一样,定位在最基本的流行病学三间分布(人群分布、地区分布、时间分布),虽然这也无可厚非,因为这是基础数据,做监测报告发表是有意义的,但肯定又会落入大众俗套,撑死发个核心。内心还算有点追求的我,再憋一口气,将多病原研究文献又认真理了一遍。此时,我又有新发现,其中有5-6篇文献做了混合感染和单病原感染的比较分析,有趣的是结论各不相同,有的认为单病毒感染和混合感染对患者致病的严重程度无差异,有的则认为混合感染比单病毒感染临床症状严重。这就有趣了,我也可以做啊,课题组每一个纳入监测的病人都有信息调查表,病例基本信息、临床症状、诊断信息和标本病原学结果大都齐全。混合感染和单病原感染的临床严重性比较作为一个论点,妥妥的一亮点,初显临床流行病学的意味。

但一张桌子只靠两条腿是站不住的,同样的,一篇文章只做两个论点略显不足,有必要再找第三个支撑点。这时候我已经对20来篇多病原研究文献熟记于心了,晃晃脑子就甩出个第三点:轮状病毒或者诺如病毒基因分型研究。因为20来篇文献里有7-8篇在描述基本流行特征后都对轮状病毒或者诺如病毒进行了分子分型,且在上述5-6篇做了混合感染和单病原感染比较分析的文献中,就有3篇对轮状病毒做了分子分型研究(分子流行病学分析),还做了进化分析,我从没接触过,就是感觉挺高大上的。于是决定也试着做一下轮状病毒基因分型特征,第三个论点就此诞生。但是从数据库导出数据后,才发现课题组没有将病毒基因分型作为一个必须要做的内容,所以很多毒株的分型信息是空缺的。不过不要紧,补呗,认定了事就要干,遂将需求电话告知远在老板身边(杭州)的大师兄,师兄百般支持,两周内把我需要的毒株的分型搞定了。齐活!最后几经讨论,精挑细选“拿来”的几个论点最终被认可。

随后就是针对每个论点分别选择2到4篇做的好的文献作为模板,“拿来”人家的行文套路,模仿人家的数据处理方式处理自己的数据(当然,中途指导老师给了大量的指导),最后花了3个多月时间整理成一篇中文,后来指导老师突然改变主意,要求改成英文,投SCI,遂又费九牛二虎之力对文章做了全文翻译,之后就是围绕即成框架不断修改、不断讨论、和最终投稿的过程了,功夫不负有心人,最后被在儿科领域具有较高影响力的一区杂志Pediatr Infect Dis J(当年IF=3.569)接收,文章题目:Viral Agents Associated With Acute Diarrhea Among OutpatientChildren in Southeastern China。作为一个硕士生,拥有一篇从想法的产生、数据的整理和写作的完成都是自己亲自操刀的文章,很有成就感。

看了这么长的文字估计大家已经有点头晕转向了,下图就是我第一篇文章三个论点“拿来”路线图,希望能够帮助大家理解。

图. 文章想法及论点“拿来”图解

以上就是我第一篇文章形成的过程,也是我做文章的第一个阶段,借此只是想说明设计一个合适想法的重要性,想法并非必须原创,通过筛选从他人的研究中原版“拿来”也是可以做好文章的。小憩一下,暂且做个小结,顺便送些干货犒劳各位听众:

1、之于想法:写论文如果找不到创新性思路,想法是可以原模原样的“拿来”的,但不是随便凑几个论点就能写出心仪的东西,要懂得挑拣,挑拣的时候把握两个点:(1)创新有两个层面,如果我们做不到“创”,但可以从“新”考虑,我的意思是,在挑选论点时,我们要多关注那些在近年的研究中才出现,成为或可能成为热门讨论的专业点,这样拿来的点最低也算得上“次新”吧。同时要关注那些科研里的矛盾,当不同研究各持己见时,就是我们介入的好机会,或则做meta分析,或则收集数据做二次分析发表自己的观点。(2)挑选后也不能立即选用,要先看自己能不能拿的动,即回过头来看看自己手头上有什么样的数据可以承载所选论点,是否有可取的途径(公共数据库、已发表文献、各种监测网等)获得足够能支持所选论点的数据。

2、之于阅读:阅读是一切写作的前提,每个科研人都会有一套自己的阅读习惯,不管以何种方式阅读(手机、电脑、图书馆;办公室,书房,大街上),只要感觉适合自己,能得到自己想要的东西就好。我这里仅给大家介绍下本人的文献管理和文献索取途径:(1)文献管理器:估计很大一部人都在用Endnote,我对这个东西不了解。我一直在用国产的NoteExpress, 全中文界面,入门简单,快速上手,而且正版也不贵!至于Endnote 和NoteExpress功能上的区别大家可以上网搜索一下,有好事的都总结的好好的,各有千秋。由于我做一篇文章时都会收集一大堆文献阅读,所以我需要首先对检索来的文章质量有个大概的了解,影响因子就是一个主要的依据,NoteExpress有个优点就是每一篇SCI文章的影响因子都会以一个单独的字段显示,且每年都会及时更新,所以我就能够按照影响因子对所有文献排序,对文献筛选及下一步的投稿有个初步定位。另外,自编参考文献样式的方法也很简单,如果样式库没有需要投稿杂志的参考文献样式或更新不及时,我可以根据杂志要求自己快速编辑并导入样式库。(2)文献索取库:1)地址栏打开http://www.xuebalib.com/,这是个收费的数据库,花点小钱购买就可(某宝150元买到永久版),内部各种中、英文文献下载数据库一应俱全,下载快速,无需等待。这里可以使用web of science,我个人是比较关注web of science的,因为它可以查询杂志的即时影响因子,当有manuscript要投时,我都会先查查欲投杂志的情况,预估会不会出现大起大落的情况,这也是投稿的一个小技巧。2)谷歌(google):平时看文献,少不了谷歌学术的。上不了google的,大家上网搜索“谷歌访问助手”,这是个浏览器扩展插件,按照要求步骤在合适的浏览器上安装就可正常使用google 搜索及其它配套google服务,包括google学术。3)几个即查即用数据库:首先是大家熟悉的那个致力于支持科研成果开源运动(Open Access movement in science)的集体,请自行网上搜索 removing barriers in the way of science可以找到它。另外,pubmedplus 文献助手(http://pubmedplus.com/#/index)、GCBI(https://www.gcbi.com.cn/)这都是中国人自己开发的,适合我们的口味,方便实用。最后,大家做个有心人,平时一定多逛逛小木虫和丁香园论坛,找到文献求助和科研工具板块,随时都有可能捡到宝贝。(3)翻译软件:强烈推荐全医药学大辞典V4(http://dic.medlive.cn/),医学专业词汇庞大!这个软件专业版只要90几块钱。而且现在开发者有意要全面免费的趋势,专业版规定可以免费试用三月,每天签到可领积分,到期后可用积分兑换就可继续使用专业版。如果积分不够,就降级为标准版,是完全免费的,比专业版少了一些功能,但影响不大,各种取词,整句翻译等等照样溜溜的。

二、工作后坚定走“拿来”路线

一年半的委培结束后,我回到杭州,按老板分配,开始做副溶血弧菌生化表型、毒力基因筛查、分子分型、耐药谱型等基础实验。在那个每天PCR做到吐血,手工血清凝集试验凝到眼神迷离,药敏纸片贴到手麻的最后一年内,我补齐了手头上近500株菌的实验数据。临结束时,我将文章初稿写好后交给细菌课题组老师,在最后一次讨论会上,导师问我文章能不能往5分以上的杂志投,我当时应了句“投投是可以的”,结果大家对我的回应方式都笑了。5分以上传染病流行病学或者临床微生物学杂志的真的是很难搞,如Emerging Infectious Diseases(EID,最新IF=8.222)、Journal of Infectious Diseases (JID,最新IF=6.273)、Clinical Infectious Diseases(CID,最新IF=8.216)等。在CDC时,传染病预防控制所一个教授就说,能在Journal of Clinical Microbiology(JCM)上发篇文章说明你做的就很可以了,而这个杂志一直在3、4分左右晃荡。13年7月份我随老婆(当时是女朋友)回江苏工作(她搞基础研究的,硕士的时候就有5分多文章,27岁就拿到国自然,我算是以一个附带品的身份过来工作的),留下我可怜未发的文章直到2015年才见世面,最终发在Clinical Microbiology and Infection(CMI)上。

接下来,就是工作后的科研状态。我这个人在原则问题上是信守承诺的,我保证毕业后就不会用实验室的半点数据私自发表东西,所以能带出来的只有想法。当时我分析的副溶血弧菌流行病学研究现状包括:一、副溶血弧菌多位点序列分型(MLST)研究刚刚进入火热状态,副溶血弧菌pubMLST公共数据库(https://pubmlst.org/vparahaemolyticus/)自2008年建库以来,不断收录世界各地菌株的管家基因序列信息,持续5年,也就是2013年左右收录的原始菌株的信息已经初具规模,这是充分利用这个数据库对副溶血弧菌开展基于MLST技术的分子分型研究的大好时机。二、副溶血弧菌种群结构分为不同的克隆群,其中最重要的一个克隆群称为大流行克隆,因其具有在世界人群内广泛快速传播的特征而得名。但目前关于大流行株的研究多在局域性报道,缺乏系统综述,仅有2007年Clinical Microbiology Review上的一篇综述对距今10年前的大流行株的传播分布进行了总结,所以,全球范围内,缺乏2007年之后大流行克隆研究的综述研究,研究者依旧引用这篇文章的结果作为基础数据,这对流行病学研究来说显然略显过时,所以很有必要更新世界范围内大流行克隆群的变异变迁、流行传播的新特征,同样,在我国也从没有一篇真正的综述性文章对大流行克隆进行过总结,这对于号称沿海地区第一位的食源性致病菌和我国丙类传染病里的其它感染性腹泻病中最重要的致病菌而言是缺憾的。

在这里插空给大家再单独介绍一下pubMLST数据库(https://pubmlst.org/),这是个公开共享数据库,最初由英国剑桥大学动物学系建立的,性质是一个Public databases for molecular typing and microbial genome diversity(网站原话)。数据库内已经建立了包括副溶血弧菌在内的96种细菌的亚库,数据库内导出的原始数据有菌株基本信息(来源、地区、分离时间等)、表型信息(耐药、血清型、毒力等)、多位点序列分型信息(包括序列型和原始序列)等。每个人都有权限上传自己的数据(上传上去的数据是需要审核的)和下载使用数据,下载下来的数据是excel格式的,非常方便统计分析。

基于以上背景,我首先抱着尝试的态度,于2014年2月份从pubMLST数据库中导出所有上传的副溶血弧菌菌株信息,筛选出来自17个沿海国家的具有完整序列信息(STs)的490株临床来源菌株,开展基于MLST的副溶血弧菌的种群结构分析,写作套路如前面所说,拿两三篇MLST相关的文章作为模板,寻找论点,填补结果。3个月后成稿,6月份投给了Plos One,8月份接收。对我来说,这篇文章最重要的不是我发现了什么,而是为了完成这篇文章,我是从零开始学习,最终掌握了菌株聚类分析、序列多态性分析及进化分析等相关常用软件的运用和结果分析,比如DnaSP(在进行种群遗传学研究时,分析核苷酸多样性和单倍型多样性等)、DNAStar(大名鼎鼎的序列分析软件,功能上主要包括序列的格式转换、拼接,两两序列和多重序列的比较,探针的设计等)、Mega(进化分析软件,做各种进化树)、RDP3(主要用于分析、检测基因序列里的重组信号)、eBURST V3 (http://eburst/mlst.net,多位点序列分型将序列型(ST)进行克隆聚类的必备软件,打开链接下载有教程)、Phylovizsoftware (http://www.phyloviz.net,多位点序列分型研究中可结合序列型和菌株基本信息进行多维度聚类分析的必备软件,打开链接下载有教程) 等,大大扩展了个人分析数据的技能。每一个软件的学习都是“拿来”的过程,因为非本专业,软件中会涉及到的一些遗传学概念如“水平转移”、“连锁不平衡”、“突变事件”、“中性理论”等背后的含义及计算结果的解释,都需要个人认真的从教程、文献甚至可靠的书籍中查阅、咨询和拿来运用。

这种自学和“拿来”的过程是辛苦的,所以我们需要表现出一定的抗击打能力,很多东西不是因为我们不会,而是出现困难时,内心已经放弃了学习的机会。我一直认为真正做文章的初衷只会有两个:一个是督促学习,一个是总结经验。而我属于第一种,虽然数据不是我的,行文思路是我“拿来”的,但我接触的领域和分析方法对我本身而言是全新的,我认真的做了,学了,用了,这就是一种成功,最起码能证明对待求学的态度上我是认真的。我从不喜欢为了写而写,而是喜欢那种按照既定的想法一步一步摸索的感觉,即使出来的东西再差也是自己汗水凝结的宝贝。

毕业后第一篇SCI已经出去,说实话心有不甘,因为从投稿到接收都很顺利,感觉自己完全可以往4分以上的杂志先试试嘛(事后诸葛亮,成功就膨胀)。想归想,即成定局,安之处之。来不及对这篇文章总结了,因为我已经发现了又一个可以写的点了。我有个习惯,公共数据库里的数据我一般会不定期(1-2个月左右)下载下来,看看更新了多少数据,是否有新字段更新。在第一篇文章成文投出去的那段时间里,我对导出来的数据字段认真捋了一遍,发现每一个菌株的核酸序列型(ST)都根据原始序列被翻译成氨基酸序列(The amino acid Sequence Types, aaSTs),也可叫肽序列型(peptide Sequence Type, pSTs),这个挺有意义,利用这个信息可以将基因水平的聚类分析转向表型水平的聚类分析。由于上篇文章已经发现高分辨率的核酸序列水平的分型方法使副溶血弧菌表现出超高水平的遗传多样性,且很多菌株无法聚类,孤立无援(singleton),或许利用pST聚类分析形成的克隆群更能接近副溶血弧菌真实的种群结构。

于是,翻阅文献发现观点确实算新,只有2013年Appl. Environ. Microbiol杂志和2014年BMC Microbiol杂志上的两篇文章涉及,发扬光大的重任看来又落在我身上了,接下来就从数据库中筛选数据的问题了,第一篇文章我选择了全世界17个国家的STs数据进行了分析,这次再从所有国家筛选数据不免有重复使用数据的嫌疑,于是我缩小菌株来源范围,决定只利用共享数据量最大的国家的数据分析,哈哈,最大的现实和便利就是中国实验室向数据库贡献最大,提供的菌株最多,于是马不停蹄从数据库中筛选出我国1990到 2014年间分离的临床菌株,背景信息完整的一共218株,有了刚刚发表的那篇论文的基础,行文套路已是驾轻就熟,彻彻底底的同时利用STs和pSTs分析对218株菌进行了聚类和进化比较分析。一个月成稿,历经两次投稿,于15年4月份在frontiers in microbiology(当年影响因子3.989)上发表。

然而,至于下一步“拿来”的想法,我已经感觉到压力的存在了,原因来自于两点:一、刚刚这篇文章最初投稿时,第一个杂志的editor 直接没给我送审就拒了,原因第一条就说我没有任何自己的实验数据,原话是there is none of experimental data, and the sequence data aredirectly obtained from the public MLST database。这是我的死穴,我也没办法。第二、以高通量测序为手段的全基因组水平遗传多态性分析初露苗头,势头就很劲猛。该技术挖掘信息的全面性和超高水平分辨率,让现行常用的细菌分子分型方法(ERIC-PCR、PFGE、MLST、MLVA等)的劣势尽显无遗,以核心基因组多位点序列分型(cgMLST)的文章潮水般涌来,再做单纯的MLST分析在国外期刊上已无卖点,必须寻找改变。

既然单纯的MLST走不通,我的目光就转向大流行克隆。我的初衷是做个系统性综述,模仿2007年Clinical Microbiology Review上的那篇综述对2007年后的大流行株的传播分布进行更新,但细细研读了这篇文章我发现我做不来,原因也是两个:一、很多机理机制的内容我不会讲(我接触的基础研究研究很少,听到信号通路和什么上下游、上调下调的概念就一脸蒙,打心里不喜欢这些东西);二、我只是个小猴猴,名不见经传,没有任何基础突然搞出个综述投出去99%会没人要。那么既要对大流行克隆做流行分布的综述,又不要落入综述性文章的行文套路中,我想出的方法是以系统综述(Systematic Review)的检索策略收集原始数据做成原创性文章(Original Research)。也就是通过在各大文献数据库严格检索文献,然后按照我预设的字段如“菌株编号”、“来源”、“检出时间”、“血清型”、“毒力基因”、“耐药性”、“序列型”等,把每一篇相关文献里的大流行克隆菌株原始信息提出来整合在一张Excel表中,我管它们叫做individual isolate data。

检索永远是一个痛苦的过程,为了防止干扰,在检索过程中,我不管原文写了什么样的内容,得出了什么样的结论,只管文章里有没有我想要的菌株信息,相同实验室或者同一作者的不同文章有没有数据重复。整个检索过程消耗了我3个月,我把检索到的几百篇文章逐一筛选,最后从39篇文章中提取了263株有效大流行株,来自于四大洲的22个国家。整理好后就作为我的原始数据,然后我以大流行株在不同国家(地区)的流行、血清型与序列型的关系、大流行株的遗传多样性分析为论点成文。然后毫不犹豫的继续投给在微生物领域杂志中全球引用次数排在第二位的Frontiers in Microbiology,这个杂志最大的优点就是采用交互式的论坛评审回复模式,审稿速度特别快,一般一月内收到评审意见。于16年4月份接受,当年IF=4.162。

因为付出了十分的努力,我一直坚信自己写的东西是有意义的。2017年6月13日,我收到了Frontiers in Microbiolgy的通知,我发在该杂志上的这两篇文章同时被选入该杂志以“Applications ofSTEM (Science, Technology, Engineering and Mathematics) tools in microbiologyof infectious diseases"为主题的eBook上,这是对我工作的又一次充分肯定。

2016年2月份在Frontiers in Microbiology杂志上有学者发文,鼓励科研人员以致病性和大流行副溶血弧菌的生态学、毒力和检测相关研究(Editorial: Ecology, Virulence, and Detection of PathogenicandPandemic Vibrio parahaemolyticus)作为研究课题(reseach topic)开展研究,这对副溶血弧菌感染的防控和毒力机制的阐明具有重要意义。我对这个topic很重视,这说明大流行株仍然是当今的热点问题,且在我刚刚发表的一文中,没有针对中国的菌株做特别的分析阐述,所以决定趁热弥补这一缺憾。于是再施“拿来”之策,检索各大文献库(中、英文均要),并最终从19篇文章中得到可以用到的individual isolate data。走与上一篇文章大致的套路,但是论点里增加了不同序列型大流行株的耐药比较分析,在耐药问题上升为全球公共卫生问题的今天,这或许就是个亮点。成文后于2017年3月份投向Frontiers in Cellular and Infection Microbiology,5月接受,影响因子5.218。

这就是工作后的科研经历,一个想法,一个数据库,无数篇参考文献,支撑了我三年,完成了4篇SCI,最后终于上5分了。一路走来,一步一个脚印,我在默默的坚持着那个最初的想法,拿别人的柴煮自己的粥,虽然辛苦但自给自乐。在此再给大家开个小灶,煮上几碗鸡汤,继续与各位分享:

1、文章中数据的使用不要怕重复,对我们这些人来说收集数据非常不易,所以要考虑到用尽用透。不同的文章是可以用相似甚至重复的原始数据的,只要出发点不同、角度不同就有人会欣赏,比如我第一篇发表在Frontiers in Microbiology的文章中的原始数据其实一部分在plos one上已用过,投稿形式审查时editor就给我提出了一个问题,请我解释清楚两篇文章数据使用问题(原话:in a previous paper by the authors (Han et al, 2014) 189 sequencesfrom China were already analyzed. Are there any of these included in thedatabase analyzed here? If so, is it justified to publish a separate paper witha subset of the population already analyzed using the same approach? Pleasejustify)。我很认真的回复了在新文章中增加的讨论点(pST),而且强调了两篇文章的出发点和目的的不同,editor对我的回答是非常认可的。

2、想法要与时俱进,适时改变,少做无用功。脑子里出现一个想法,要回答三个问题才可使用:为什么这个想法有必要?目前的研究现状是什么样?这个想法实施后什么问题能够得到解决?就像我舍弃继续利用pubMLST数据库做文章的想法,以后是全基因组测序的时代,像MLST和MLVA等基于几个基因测序开展进化分析的研究将不再是主题,尽管庞大的MLST数据库数据还可以做很多方面的分析,比如做不同来源(环境、临床或爆发)菌株的分子分化、变异变迁的比较分析,但我感觉即使写出来在国内文章发发还可以,即便投SCI,上三分也很难。我的下一目标是收集副溶血弧菌的全基因组数据,且我现在已经在学习和熟悉各种基因组序列分析软件的路上了……

3、说说投稿,上面我没仔细讲投稿的事情,其实没那么轻松,比如我上学时的那篇文章,先后投了6个杂志最后才被Pediatr Infect Dis J接收,不过我从没灰心过,我对editor和reviewer的每一个问题都会认真回答,我认为认真阅读每个问题并尝试着回复修改,这本身就是一个快速提高的过程。我敢说我们周围肯定有很多人投稿被拒时,不会认真看拒稿原因,更不会去修改原稿,而是骂上一句运气真背,继续将原稿投向另外一个杂志,我不赞同这样的做法,我认为每一个反馈意见对我们都很重要,它们能够帮助我们权衡我们的研究是否真正存在问题,是否需要改进。

除了对待专业问题的态度,最大地问题是语言问题,如果你的目标在3分以上的杂志,那么别犹豫,请把你的manuscript拿给英语真正牛逼的人帮着修改,或者直接去润色公司帮着修改语言。不要抱着试试看的态度先投出去,否则你有可能形式审查都通不过,我第一篇文章投的杂志有两个都给我直接拒了,让我先润色再投,当时不舍地花钱就随便找人改改,结果接连碰壁,后来没办法找老板要钱专门去润色才避免了悲剧的在发生。我现在自己写的还过得去,而且我家婆娘英语牛逼,所以我现在也不怕英语不过关,但是闹情绪的时候,咱还得悻悻地找润色的去,所以爷们儿们,这也体现出平时照看好老婆的情绪有多大的“显著”意义了。

以上是我对整个科研生涯的回顾和小结,自学领域里个人观点不免会出现主观偏见,甚至错误,多请谅解。其实很多时候,我非常羡慕那些在导师的引领下,手头上有自己试验数据的人,但是在得到下一个导师认领前,我会坚定践行“拿来主义”,延续自己的科研梦。

大数据之父舍恩伯格说“大数据的核心要义在于共享”。在如今大数据研究背景下,全球都在强调资源共享,开源性期刊越来越多,所以公共数据的获取途径也会越来越方便,只要我们做个有心人,“拿来”的只会越来越多,越来越好。

不付十年寒窗苦,哪得梅花一径香。普通大众没有谁比谁更聪明,比天赋的年代在未成年,走在成年轨道上的我们,要出人头地完全取决于比周围人多一分的刻苦和坚韧,哪怕多那么一点点。

话说回来,科研这东西,没有SOP,没有学历限制,有想法就玩儿,别犹豫,配上点抗击打能力,干就完了!!!

最后送大家打油词一首,与各位斗士共勉:

    江城子 · –科研之路

科研探索路茫茫,无思想,难成章。挑灯夜读,孤寂勿声扬。紧抱文献一篇篇,废寝食,乐专研。

夙兴夜寐搞实验,求知路,逆境天。无惧失败,起身扛孤单。待到成果香满园,身心泪,付云烟。

献丑了……

韩东升

2017.7.23 于扬州

韩东升生活照 | 由作者提供

此文为《临床研究经典案例解析》作者招募活动投稿文章。

作为一名临床一线医生,每天除了要完成临床常规以外,还要积极开展科研,提升自己的学术水平。过去的几年,想必你也看了不少本专业的主流临床研究文献,写了不少高水平的SCI论文。然而,并非每个人的临床科研之路都一帆风顺,很多同行都想开展临床研究,但是苦于没有人带路,一直在黑暗中苦苦摸索。

你是否想过将你看文献、做临床研究的心得、体会、观点等全部记录下来,和同行一起分享呢?

机会来了!

经过前期的筹备,《临床研究经典案例解析》一书现面向全宇宙招募作者!

欢迎点击左下角“阅读原文”了解作者招募详情。

comments powered by Disqus

附件