微信直播

开放数据库Dryad在临床研究领域中的应用

Published at: 2015年第1卷第S1期

王晓燕
关键词:

第一节:开放数据库Dryad在临床研究领域中的应用

第二节:Dryad在心血管疾病研究领域案例分析

作者:王晓燕白英楠戴启盈赵公双4

1.复旦大学中山医院,心内科

2. 复旦大学中山医院,心内科

3. Metrowest Medical Center, Framingham, MA, USA

4. 沈阳军区总院,心内科

第一节 开放数据库Dryad的使用

1. Dryad数据库简介

Dryad数据库是2008年9月由美国国家科学基金会资助建立。Dryad数据库是存放优质数据资源的场所,使科学出版物背后的数据可被发现、可重复使用、可引用,其目标是与学术团体、出版、研究和教育机构、基金资助机构和其他利益相关机构构成学术交流体系来协同、维持和促进学术文献中基本数据的保护和再利用。Dryad提出的联合数据存档策略被许多主流期刊采纳,并推荐Dryad作为存放数据场所。

作为数据库,Dryad支持存放各种类型数据,包括文本、图像、表格、音频、视频等,提交的数据文件拥有永久可解析的DOI标识。Dryad数据库中数据可提供下载和重新利用,排除经期刊编辑部允许,暂时限制使用的数据。利用Dryad数据库,研究人员可获取数据,研究和验证公布的数据是否合理,或解决新问题。特别值得注意的是,Dryad数据库无需注册即可免费获取相关数据。

1.1 Dryad官网:结构和功能

Dryad官网地址:http://datadryad.org/。Dryad官网提供面向全部用户的公共信息和面向注册用户的个人空间(包含注册用户提交的数据资料、个人信息等)。Dryad官网主菜单包含Dryad相关信息(About)、以及面向研究人员(For researchers)和研究机构(For organizations)的工具栏(图1)。

图1. Dryad主页

Dryad相关信息包含机构介绍、团队介绍、数据库特点和数据库采用技术、数据库使用规则、Dryad博客、招聘信息、会员会议、常见问题;面向研究人员的工具栏包含提交数据、使用数据、查询期刊是否为Dryad数据库合作期刊、缴费说明、支持机构、DryadLab教学资源、使用说明;面向研究机构的工具栏包含 加入Dryad、提交期刊数据、成为会员、会员会议、付费种类、付费种类比较(图2)。

图2. Dryad主菜单

2.2 检索研究数据

如已有明确的目标研究,可在检索框内输入目标研究的标题、DOI等信息进行精确检索;如无明确的目标研究,但有对应的研究主题,可在检索框内输入关键词;如想了解某领域的大咖是否有研究数据发表在Dryad网站上,也可输入大咖姓名(图3)。

图3. 检索目标研究数据

如果没有目标研究、研究主题,也可浏览Dryad数据库中已包含的数据资源(按时间和下载量排序)(图4)。

图4. Dryad网站包含的数据资源

2.3 下载研究数据

下面,我们以实例演示如何在Dryad官网上下载数据资源。

假设我们检索关于“高血压”的数据资源,在首页检索框内输入“hypertension”进行关键词检索(图5),进入”高血压“数据资源页面(图6)。

图5. 以“hypertension“为关键词进行主题检索

图6. 检索结果页面

如图6所示,Dryad数据库中高血压相关的研究共32项,也就是说我们可以在Dryad数据库中获得32项研究的数据资源。图12右侧边栏可见,检索到的研究结果可按照作者、主题、发表时间、发表期刊进一步具体到更精准的研究。此处应注意,右侧边栏的子文件夹有大小写之分,因此Diabetes和diabetes是两个不同的文件夹(图7),因此检索时两个文件夹均应查看,以防遗漏。在本例中,点击“Diabetes“子文件夹,出现4项研究,点击”diabetes”,出现2项研究,且这两项研究均已包含在”Diabetes”子文件中。

图7. 文件夹筛选

假设我们按照期刊选择,以“BMJ Open”为例,共9项研究的数据可供使用,这时我们再根据自己的研究目标选择恰当的研究。以第一项研究为例,点击进入目标研究主页面,研究主页面信息包含研究基本信息、数据下载地址、文献引用格式、研究摘要等信息(图8)。此处的数据储存文件格式为.xlsl,下载之后可导入SPSS、Stata等统计软件中进行后续分析。

图8. 目标研究主页面

Dryad数据库中,数据的储存格式除了.xlsx以外,还有sav等格式,此时,应利用SAS软件进行分析。如BMC Cardiovascular Disorders期刊的数据存储格式为sav(图9)。读者可根据不同的数据存储格式选择适当的统计软件分析。

图9. BMC Cardiovascular Disorders 数据存储类型

第二节 开放数据库Dryad在医学研究领域中的应用

1. Dryad开放数据库使用案例

笔者并未在Pubmed中检索到利用Dryad数据进行分析的心血管研究(尽管笔者目前有一篇使用Dryad数据的文章正在修回),因此,笔者仅以检索到的一篇公共卫生领域的文章阐述Dryad数据库在科学研究中的应用。

图10. Dryad开放数据库在临床研究中的应用

1.1研究背景及思路浅析

为提高临床研究的透明度,2007年开始,美国食品与药物管理局修正案(FDAAA)规定,临床研究均应在ClinicalTrials.gov官网注册,具体要求如下:1,临床研究应在第一位患者入选后21天内完成在ClinicalTrial官网的注册;2,研究结果应在设计的研究截止时间后1年内提交至ClinicalTrial网站,研究结果提交至ClinicalTrial官网的时间也被成为【总截止时间】(primary completion data(PCD);3,药物研究中,如果该药并未被审批通过,则研究结果无需提交至ClinicalTrial官网。此外,FDAAA可允许部分研究申请延迟结束(certificates of delay, CODs),对于药物研究,如果这一药物未被审批,那么针对这一药物的临床研究结果可在这一药物审批通过后30天内提交;如果这一药物已被审批通过,但此项研究是评估这一药物新的疗效,那么相应的临床研究结果可在新疗效被审批通过后30天内提交(最长延迟至提交COD申请后2年)。但是这一规定也有矛盾之处,如果药物未获审批,而临床药物研究已经完成,研究人员是否需要申请COD?根据规定,未获审批的药物进行临床研究,研究结果无需提交,因此也无需申请COD;但同时FDAAA又规定临床药物研究结果应在药物审批通过后30天内提交。

因此,2016年9月,NIH针对【未获审批的相关药物】研究作出规定:此类研究的研究结果应提交,提交时间应在研究的总截止时间(PCD)后的一年内,如研究人员提交了COD,那么研究结果提交时间可推迟至药物获批后30天内(最长可至提交COD申请后2年)。此项新规仅对2017年1月18日后开展的临床药物研究有效,此前开展的药物研究,如药物尚未获批,则无需提交研究结果。

为评估当前临床药物研究是否遵循FDAAA相关规定进行研究注册、提交研究结果,Miller等人针对2012年获批的新药相关临床研究进行调查,发现这些新药临床研究并未完全依照FDAAA相关规定进行。未进一步明确临床药物研究的合规程度,本篇文章对Miller这项研究中涉及的药物研究进行再次评估,,评估指标为临床研究注册是否及时、研究结果提交是否及时、是否遵循FDAAA相关规定。

1.2 研究方法

本项研究针对Miller这篇文章中的15项临床研究合规程度进行再次分析。数据一方面来源于Miller等人发表在Dryad上的数据,同时包含了ClinicalTrials和FAD官网上的数据,此外研究人员还对这15项临床研究所涉及的制药公司进行电话回访获取数据,最终研究人员汇总了这三方面的数据,对新药研究的合规程度进行了再次分析。汇总分析结果显示,新药临床研究合规程度很高,没有那么多比例的延迟注册、延迟上报结果等违规行为。

图11. 病例对照研究的合规程度

图12. 干预性研究的合规程度

1.3 点评

咋一看文章选题并非特别创新、统计学方法也不那么高大上,甚至也没什么实用价值,不就是药物临床研究进行的都很规范嘛!但是它同样提供给科研新手一些启发:1,如果你没有很好的idea,那么不妨看看前人的文章,从其中选取一个小点切入,哪怕是对前人的研究结果进行再次验证也可以啊!以本篇文章为例,作者怀疑Miller等人的研究结果,于是不仅仅使用了他们的研究数据,还整合了更全面的数据信息,因此再次验证的结论更加可靠。2,数据是文章根本,科研新手写不出文章,往往是因为没有数据。但是公共数据库的存在在一定程度上解决了数据匮乏这一难题,Dryad, BioLINCC, MIMIC, SEER, NCDB等数据库或许真的可以为你打开新世界。3,文章价值的自我阐明很重要,以本篇文章为例,研究结果是目前药物临床研究合规程度很高,那么这一结论价值在哪里?文中作者写到,临床研究的合规程度有助于提高药物临床研究的透明度,从而保障药物研发的安全可靠程度,因此对于临床研究合规程度的评估应该严谨。看到没,这是本篇文章的价值所在。

综上,善于利用公共数据库资源,从选题、研究思路、统计方法、论文撰写等几个方面精心雕琢,或许你也可以实现从科研新手到科研新星的华丽丽转身。

相关阅读

BioLINCC在心血管疾病研究领域中的应用

作者:王晓燕

comments powered by Disqus

附件