微信直播

AME科研资讯| microRNA测序中批处理效应的消除策略

Published at: 2015年第1卷第S1期

王栋 1
1 山东大学附属山东省立医院
关键词:

编者按:随新一代基因测序技术RNAseq技术价格“亲民化”,microRNA测序中批处理效应渐受重视,而AME旗下TCR杂志2014年6月特刊 "Statistical and bioinformatics applications in biomedical omics research" 中 "Statistical strategies for microRNAseq batch effect reduction" 一文,正好探讨了同一研究中,使用6种消除批处理效应方法产生的不同结果,为与大家分享其中经验,小科邀来了山东大学附属山东省立医院王栋医生对该文进行了编译解读,畅谈microRNA测序中批处理效应的消除策略。

基因表达是指储存在DNA序列中的遗传信息经过转录和翻译,最终合成具有生物活性的基因产物的过程,是生物医学研究的核心内容。传统的基因表达研究主要依靠基因芯片技术,而现在,新一代基因测序技术为我们带来了RNAseq技术。RNAseq技术较之基因芯片技术的优越之处,在于它不仅仅能检测探针包含的序列,还可以为外显子、转录物及cDNA序列测序。随着RNAseq技术的价格与基因芯片技术趋于一致,其应用正在变得越来越广泛。

RNAseq技术另一个有意思的特点是它可以为microRNA测序。microRNA是一种小的、非编码的片段,可在基因表达的调节中发挥多种多样的作用,已发现的microRNA已超过2000种,它的失调控与多种疾病相关。

目前,对RNAseq技术的一个常见的错误认识是认为它是一种基因定量技术。事实上,RNAseq技术与基因芯片技术一样,均是定性优于定量。RNAseq技术需要样本在至少两种状态下的结果来获取相对可信的数据,一种状态下的检测结果仅能用于定性;只有在极少数的情况下,当所有反转录的cDNA均已被测序时,RNAseq技术可用于定量,而即使在如此严格的条件下,RNAseq技术的检测结果仍可能被PCR所影响。

处理RNAseq技术获得的数据同样是一个巨大的挑战,实验数据的获取与处理过程中存在诸多不稳定因素,均可能影响最终的结果。针对这些影响因素,研究人员尝试了多种分析方法以求获得可信的结果。这其中最常见的标化法为RPKM法或FPKM法。

批处理效应是实验过程中诸多偏倚的技术来源。批处理效应的影响因素有时间、位置、仪器和操作者不同等因素。另外,批处理效应还可能存在尚未发现的影响因素。在基因芯片的数据处理中,已发展出多种消除批处理效应的方法,而在RNAseq实验中,尚有一种额外的批处理效应,那就是测序结果的数量;例如,一个可检测4千万个片段的检测组合可检获的基因序列当然会比一个可检测2千万个片段的组合检获的序列要多。而样本质量、序列长度、检测范围、片段化等因素均可影响microRNAseq的结果,因此,须行2-3次检测以获取可信的结果。

研究者采用了实时miRNAseq法分两次检测了24例患者的肝脏样本,结果显示,这两次实验的整体结果有明显的差异,与想象中的一致性相去甚远。研究者用cluster法评估了亚分型的精确度,初步结果显示精确度为8.3%。为了尽可能地消除批处理效应,研究者采用了6种不同的方法并做了比较。这六种方法分别是:quantile normalization, conditional quantile normalization, noise reduction technique, median center, total read count normalization和 trimmed mean of M-values。最后,不同的方法得出了不同的结果,这个事实也说明了消除批处理效应的这些标化法很难判断孰优孰劣,而且它们之间存在着严重的分歧。

通过分析得到的数据,研究者发现批处理效应会显著地影响基因表达的分析结果,而对于片段更短的miRNA来说,这种影响会更加明显。经过比较可能降低批处理效应的6种标化方法,最终发现median center法有更好的效果,在此研究基础上,研究者建议在处理miRNA测序结果时选择median center法,以尽可能地消除批处理效应。

笔者| 王栋,山东大学附属山东省立医院主治医师。擅长普胸外科各种疾病如肺癌、食管癌、纵膈肿瘤等胸部肿瘤及非肿瘤性疾病的早期诊断和以手术为主的多学科综合治疗。主要从事肺癌、食管癌发病机制及分子靶向治疗方面的基础及临床研究。

 

杂志介绍

Translational Cancer Research (《癌症转化研究》,简称TCR杂志;Print ISSN: 2218-676X; Online ISSN 2219-6803, www.thetcr.org), 是以台湾大学 Eric Chuang 教授为主编,Scripps Proton Therapy Center 中心主任 Huan Giap 医生、中国医学科学院徐兵河教授为副主编的一本肿瘤期刊,创刊于2012年,为双月刊,同是开放获取同行评议的国际期刊。作为基础研究和临床治疗之间的桥梁,杂志主要发表关于肿瘤的危险评估,细胞及分子特性,预防,检测,诊断及治疗方面的最新研究结果、最新技术和治疗方案。目前出版的特刊中,肿瘤的放射治疗占有一定比重。

TCR 杂志近期邀请到美国 Moffitt 癌症中心的 Dung-Tsa Chen 博士和 Yian Ann Chen 博士共同担任客座主编,组织"Statistical and bioinformatics applications in biomedical omics research" 特刊,于2014年6月顺利出版。

本文题图来自网络……

本原创文章由科研时间首要发布,媒体转载请注明出处。欢迎大家关注【科研时间】,和我们一起爱临床,爱科研,也爱听故事。

点击【链接】查看被编译文章 "Statistical strategies for microRNAseq batch effect reduction" 原文全文:http://www.thetcr.org/article/view/2652/html

Doi:10.3978/kysj.2014.1.255

comments powered by Disqus

附件