微信直播

AME科研资讯|聚类分析解码多病因疾病?

Published at: 2015年第1卷第S1期

陈文森 1
1 南京医科大学第一附属医院
关键词:

编者按:统计方法与女孩子收拾东西有异曲同工之妙?如何用更广阔视野去解读多病因疾病的发生?江苏省人民医院医院的陈文森医生对AME旗下TCR杂志6月特刊"Integrative clustering methods for high-dimensional molecular data" 一文进行了编译解读,用幽默的语言,形象的比喻,深入浅出地探讨了综合聚类分析对多病因疾病研究的巨大推动作用。

聚类分析(Clustering)想必大家并不陌生,我们在很多案例里面可以看到,通俗一点说就是分开并归类,好比女孩子喜欢整理东西,相似的放一起,又比如医院里面大类分外科、内科、妇科、儿科,里面单一科室又分很多专科等等。肿瘤学机制研究里面基于通路的基因型表型研究也可以归类,微生物学中来自于不同科室的菌株可以聚类,感控研究中爆发时候MDRO(超级细菌)聚类分析还能帮忙寻找源头等等,应该说应用很广泛。

Fridley BL研究团队发表了这篇统计方法学的综述(Integrative clustering methods for high-dimensional molecular data. Transl Cancer Res 2014;3(3):202-216)很有意思,讲的就是这个问题,但是与以往不同的是,他带来了另外一种思考问题的角度,准确一点说应该说是进一步视野的提升,将不同领域、学科的信息整合。抑或改变的是一种思维模式,由局限于单一领域的研究,寻求其他学科的整合与融合,来解读多病因疾病的发生。

肿瘤,作为一种常见的多病因疾病,对其发病机制的研究当今医疗卫生领域研究的热点内容。人类基因组计划(human genome project,HGP)(由美国科学家于1985年率先提出)也为肿瘤分子流行病学(Molecular epidemiology)研究提供了重要的工具和依据,高通量(High throughput)检测技术(如illumina公司的测序技术)更为肿瘤分子流行病学研究提供了强有力的技术支持,GWAS研究让关联研究达到了一种前所未有的高度,然而我们不免会有疑惑,so what?我们解决了问题了嘛?肿瘤的机制我们阐明了嘛?它涉及了太多的内容,也涵盖了太多的学科,如基因组学、转录组学、蛋白组学、表遗传学等等,如果说高通量技术提供的是技术视野,在阐明肿瘤基础病因的时候,却有这样的疑惑:哪些原因是重要的,发挥着最重要的作用?而对于单一组学(omic)的聚类分析(如K-means clustering,Hierarchical clustering,Fuzzy C-means clustering等),随着高通量技术平台的开放,更多数据的开放,甚至未来大数据的应用,呼唤综合聚类分析(Integrative clustering methods),如Mixture-model应用。内科医生,不会头痛医头脚痛医脚,综合全面的分析解读病因的道理。运用这样的技术,能够便于整合归类肿瘤病因中的不同研究领域的信息关联,对于病因阐释和靶向疗法研究,及随后的生物学机制解读,均有巨大的推动作用。

当然,这个方法还有一些关键点应该被清醒的认识到:

聚类分析的任务:找出度量观测或变量相似程度的统计量;根据这些统计量寻找到合理的分类方法并归类;

聚类分析可以对样品分类也可以对变量分类,但不是统计学假设检验,他提供的还是一种线索。

此外,如果非要吹毛求疵,正如文章设计是systematic review,还是建议按照PRISMA清单要求操作为宜。尽管如此,还是值得精度的一篇美文,通俗而富有启发性!

笔者| 陈文森,南京医科大学第一附属医院/江苏省人民医院医院感染管理办公室主治医师。AME 学术沙龙委员,中国医院协会医院感染管理专业委员会青年委员,中华预防医学会医院感染控制分会青年委员。

 

杂志介绍

 

Translational Cancer Research (《癌症转化研究》,简称TCR杂志;Print ISSN: 2218-676X; Online ISSN 2219-6803, www.thetcr.org), 是以台湾大学 Eric Chuang 教授、Scripps Proton Therapy Center 中心主任 Huan Giap 医生为共同主编,中国医学科学院徐兵河教授为副主编的一本肿瘤期刊,创刊于2012年,为双月刊,同是开放获取同行评议的国际期刊。作为基础研究和临床治疗之间的桥梁,杂志主要发表关于肿瘤的危险评估,细胞及分子特性,预防,检测,诊断及治疗方面的最新研究结果、最新技术和治疗方案。

本文题图来自网络……

本原创文章由科研时间首要发布,媒体转载请注明出处。欢迎大家关注【科研时间】,和我们一起爱临床,爱科研,也爱听故事。

点击【链接】查看被编译文章 "Integrative clustering methods for high-dimensional molecular data" 原文全文:http://www.thetcr.org/article/view/2648/html

Doi:10.3978/kysj.2014.1.323

comments powered by Disqus

附件