微信直播

在这个资源紧缺的世界提高诊断研究的准确度:路在前方?

Published at: 2015年第1卷第S1期

LippiGiuseppe , MarioPlebani
关键词:

编者按

规范论文写作一直是学术界老生常谈的问题,规范学术论文撰写的呼声从未中断。STARD报告规范于2003年一经发布,便轰动了学术界,引起广泛重视。时隔12年,2015年底STARD报告推出了更新版,在2003版的基础上“大刀阔斧”、甚至是伤筋动骨的修改,系统总结了十余年来STARD报告规范在实施过程中的经验教训,最终形成了30个报告条目。

Annals of Translational Medicine杂志的Associate Editor-in-Chief Prof. Giuseppe Lippi和Executive Editor Dr. Zhi-De Hu精心组织下,我们邀请了包括三大检验医学杂志主编共议STARD: Clinical Chemistry and Laboratory Medicine的主编Mario Plebani、Clinica Chimica Acta的主编Alan H. Wu和威名远扬的实验室循证医学家Robert H. Christenson、Clinical Biochemistry的主编Peter Kavsak, 发表对STARD 2015的看法。同时,身为2014年美国临床化学协会(AACC)Patient Safety Award得主Prof. Lippi 作为客座编辑,为这场STARD论坛作了一篇高瞻远瞩的序言。非常感谢来自天津市第四中心医院检验科赵爽医生的专业翻译!

 

作者|Giuseppe Lippi,Section of Clinical Biochemistry, University of Verona, Verona, Italy; 

Mario Plebani,Department of Laboratory Medicine, University Hospital of Padova, Padova, Italy.

译者|赵爽,天津市第四中心医院检验科。

客座编辑|Prof. Giuseppe Lippi

Section of Clinical Biochemistry, University of Verona, Verona, Italy.

 

诊断实验

世界范围内的宏观经济刚开始从史无前例的经济危机中复苏,这场经济危机已经深刻的改变了全球主要国家公共卫生体系的组织结构(1)。在大多数发达国家和新兴发展中国家,公共卫生健康支出在整个国民生产总值(GDP)中的比重呈现增加趋势,其增速远远高于其他经济门类,并成为名副其实的国家预算最大组成部分(高达10-12%)(2,3)。由于在诊断技术和靶向治疗领域中显著的进步,多数国家的公共卫生体系都遭遇到两难境地:不断增加的尤其是住院护理和医药相关的费用与不断减少的政府资金资助。如何对整个卫生体系进行重新调整以适应并有效提供更高质量的健康服务——这一问题对于私人和公共医疗服务购买者而言是至关重要的。

目前有确凿的证据表明实验室诊断也称为体外诊断(IVD)实验对大多数(如果不是全部)人类疾病的筛查、诊断、预后和治疗监测提供各式各样有临床价值的信息(4)。虽然毫无疑问由这一科学技术及医学分支所产生的数以千万计有价值的数据正在改变我们诊断和治疗的方式而且诊断实验相应的费用仅仅轻微影响公共卫生总体费用支出(仅在1.5%到2%之间)(5)。但是检验管理人员和高级专业人员仍然被迫面对着巨大的经费削减压力,这包括了实验耗材和人工费用还包括对实验室精简以求更具效率,然而这常常与提高临床应用效率是相悖的(6)。与其他医学分支不同,诊断实验始终都在不断变化中,其特性既无法界定又向四面八方扩展开来。传统意义上的临床实验室/检验科模式在近些年中有了戏剧性的改变,它向着由基因组学、转录组学和蛋白组学技术相互渗透的方向发展。肿瘤诊断即是一个当代技术进步如何影响临床医学的典型范例。随着肿瘤愈来愈多地被认知为一种高度异质性和个体化的疾病—向个体化医学发展的趋势需要根据独特的遗传性状(即药物基因组学)对每一位患者的肿瘤都进行个体化治疗(7-10)。例如在乳腺癌中,HER/neu是单克隆抗体曲妥珠单抗的靶点,因此患有HER/neu过度表达恶性肿瘤的女性将可能从这一治疗中获益,其疗效对于肿瘤转移还是辅助治疗方面都是肯定的(11)。 相反的是,遗传学研究同时也揭示在不同类型肿瘤间存在共同分子标志物和生物学通路,因此对某一种肿瘤有效的治疗可能也能用于其他肿瘤的治疗。然而,IVD实验所提供的有趣且价值不菲的前景需要依靠严谨的方法从基础及验证研究中获得可靠的科学证据。

诊断准确度研究报告标准(STARD)

不准确报告是当前生物医学研究中可以避免浪费资源的首要原因。首当其冲的是,因为几乎无法获得必要的数据,所以做出关键评价和重复实验就是根本不可能的。STARD制定于2003年,其目的在于提高做为科技文献、会议摘要或收录于临床试验注册相关文献中的诊断研究的准确性(12)。初版STARD文件以流程图形式列出了25个具体条目,目的是提供关于实验对象纳入最佳样本量、招募方式、实验顺序、技术文献及基准技术的详细信息。STARD的一些局限性被关注,尤其在非侵入性肝纤维化生物标志物方面;对于将此指南进一步延伸细化的建议亦有所报道(13)。在初版问世近20年后,专家组发布了这一指南的更新修订版(14)。新版STARD2015沿用了前一版的篇章结构,但将条目扩充为30条同时将同类问题进行归纳。更具体的说,新版替代旧版并为从题目到讨论各个环节的诊断准确性研究计划提供了一个清晰实用的指南。这里需要特别关注的是“方法”一节,包括研究设计、受试者(例如入选标准)、实验方法(例如适当描述待验证及参考方法,选择诊断阈值)及数据分析(例如合理应用以评估诊断实验准确度)。值得关注的是,STARD2015版还对关键术语做出了清楚的定义(例如定义了医学实验和待验证实验、理想状态、临床参考标准、敏感度、特异度、实验的使用及地位),还包括了一个设想图其中规划了受试参与者在整个研究中的去向。在新版STARD的所有条目中,有两个值得特别关注。具体说是完整的研究计划书应向读者公布以便能重复该研究并作出关键评价。指南特别强调了对研究基金的声明,这样潜在利益冲突就能被论文编辑和读者充分知晓。

通过修订的STARD2015版的发表能够清楚的看出,在不久的将来对于诊断实验准确度研究数据的报告可能以一种更为合理和标准的形式进行。这一形式由全国性和国际科研协会推荐并被本领域的专业出版机构所普遍采用;一个更加严谨的方法能增加不同调查研究间的可比性(且减少基于小样本量研究数据meta分析综述的异质性)从而产生更为可信且确凿的科学证据,这些证据可以引出(或维护)在医疗卫生领域内的诊断实验、帮助确证新开发的生物标志物或相关技术并有助于其转化为实用技术进而为患者提供最好的医疗服务并尽可能有效利用医院资源。实际上,STARD2015版指南同时也是对诊断实验准确度研究质量评估2(QUADAS-2)的有效补充,后者是在对诊断准确度研究进行系统综述时广泛应用的工具(15)。无论如何,虽然偶有瑕疵但修订的新版STARD2015指南毫无疑问的有长足进步的。

诊断实验的准确度应如何定义?

诊断准确度(或性能)的传统定义为一个实验鉴别或排除某种疾病的能力,而诊断效能(或效果)则定义为同一实验是否能对医疗诊治产生显著改变并最终对临床结局产生实质性改善(16)。实际而言,诊断性能(准确度)仅仅表达了其能正确鉴别一种特定情况(疾病或疾病进程及状况)的准确度,同时应当意识到出色的诊断性能并非必然能转化为临床结局的改善(例如,准确但耗时的诊断实验对于转移性肿瘤死亡率无正向影响)。传统意义上的临床效能意味着某一特定的医疗干预在临床实践中对患者到达首要或次要终点有实际帮助(17)。

STARD是普遍适用的吗?

普遍适用通常会有风险存在,在自然科学和医学领域尤其如此。出现一些合理的质疑,其中有人怀疑STARD指南标准是否能无差别的适用于新研发的和原有生物标志物的诊断准确度评估;或者适用于对原有初始方法或随后改进的商用试剂盒的评价。这个问题并非无关紧要,因为基础科学和临床应用研究常基于不同的认知基础因而经常要达到的目标也大相径庭。假设生物标志物被偶然发现并揭示复杂的生物通路加深我们对健康与疾病的理解;在这种情况下,应用如此严格的标准就没有必要;相反的,商用诊断试剂盒的确证则是另外一种情况,需要确认其是否与参考方法一致,最好能确定其检测结果对临床决策是否产生显著影响。

我们能在STARD标准中增加些什么吗?

STARD2015版所包括的30个条目的清单实际上已经很详尽而准确了,它所针对的是大多数贯穿诊断准确度研究数据报告始终的关键步骤,尽管如此,由于无法对评价诊断性能的最适方法进行精确定义,因此只能在分析数据时允许应用自由度较大且较为随意的方法。做为一项试验性指南就如表1所描述的,对于STARD2015版未尝不是一个明智的附录。

诊断实验的历史因诊断准确度(性能)的狭窄概念而被限定性的造就。简而言之,多年来我们被问及最多的且大家高度关注的问题例如“这一检测能有助于我的最终诊断吗?”或者“这一实验有助于我排除某种(类)疾病吗?”亦或者“新检测方法与参考方法的一致性良好吗?”,以纯粹的临床视角看,诊断实验的全局与其特征形式截然不同,但我们经常“一叶障目不见泰山”。一个临床信息与体格检测、影像诊断或检验结果相结合的附加价值是有机会对疾病的临床进程产生积极影响,这意味着生存时间的延长或生命质量的提高。因此,这一评价诊断实验的新模式提示应将诊断准确度的狭窄定义扩展开,更加注重临床实际效用。目前研发的一些工具(指南或标准)将助力这一转型。《评估、研发及评价决策证据建议的分级(GRADE-EtD)》框架的目的是提供一个全面系统清晰的方法将临床证据转化为指导医疗的建议和行动。GRADE用于诊断实验应被视为一种精确评估诊断实验准确度的资源,同时亦是对评价其对临床关键终点例如死亡率、发病率和生命质量影响的一种工具(18)。费用-效率分析是一种成熟的医疗技术评估方法,也从本质上证明一个具有高度诊断准确性的引用方法确实能转化为医疗和经济效益。

结论

面对资金(基金)较少和检测数量与复杂度不断增加的矛盾,根据循证(检验)医学的原则,诊断实验资源应当增加供给。这一领域的未来还未可知,许多潜在的情况如商用试剂盒进行高通量多项目分析等不断出现(21)或使用手机对传染病进行快速诊断(22)。实际上,我们认为博众家之所长的STARD2015版标准可以看做是在这个资源短缺的世界上提升诊断实验准确度的一次前进。然而,STARD2015并非完美无缺尚有许多问题有待解决。在检验与临床之间架起沟通的桥梁,促进检验诊断准确度原有概念与临床效用的相互融合并将关注点放在个体医学上都是提升诊断实验价值的大好机会。

  • 评估诊断准确度的统计学标准:

总体

数据的统计分布(正态,非正态,偏态)

统计学显著性差异的数值(例如,P<0.05;P<0.01等)

与参考方法相比较

相关性,线性回归分析,Deming拟合

偏移的估计(例如,通过Bland-Altman点分布均值)

诊断一致性(例如 κ统计分析)

与临床结局相比的诊断性能评价

敏感度与特异度

阴性预测值(NPV)和阳性预测值(PPV)

阴性似然比(LH-)和阳性似然比(LH+)

诊断比值比(DOR)

受试者工作曲线(ROC)的图像呈现

实验所需样本量(NNT)

 

声明:无

注脚:利益冲突:作者声称无利益冲突

参考文献:

  1. Appleby J, Helderman JK, Gregory S. The global financial crisis, health and health care. Health Econ Policy Law 2015;10:1-6.

  2. Budhdeo S, Watkins J, Atun R, et al. Changes in government spending on healthcare and population mortality in the European union, 1995-2010: a crosssectional ecological study. J R Soc Med 2015;108:490-8.

  3. Zhang W. The other side of the Chinese economic miracle. Int J Health Serv 2012;42:9-27.

  4. Lippi G, Plebani M. Laboratory medicine does matter in science (and medicine)… yet many seem to ignore it. Clin Chem Lab Med 2015;53:1655-6.

  5. Lippi G, Mattiuzzi C. Testing volume is not synonymous of cost, value and efficacy in laboratory diagnostics. Clin Chem Lab Med 2013;51:243-5.

  6. Plebani M. Clinical laboratories: production industry or medical services? Clin Chem Lab Med 2015;53:995-1004.

  7. Alix-Panabières C, Pantel K. Real-time liquid biopsy: circulating tumor cells versus circulating tumor DNA. Ann Transl Med 2013;1:18.

  8. Ryu JS, Memon A, Lee SK. ERCC1 and personalized medicine in lung cancer. Ann Transl Med 2014;2:32.

  9. Zhai H, Zhong W, Wu Y. Research, evidence, and ethics: new technology or grey medicine. Ann Transl Med 2015;3:15.

  10. Lippi G, Plebani M. Personalized medicine: moving from simple theory to daily practice. Clin Chem Lab Med 2015;53:959-60.

  11. Cho SH, Jeon J, Kim SI. Personalized medicine in breast cancer: a systematic review. J Breast Cancer 2012;15:265-72.

  12. Bossuyt PM, Reitsma JB, Bruns DE, et al. Towards complete and accurate reporting of studies of diagnostic accuracy: the STARD initiative. Clin Chem Lab Med 2003;41:68-73.

  13. Boursier J, de Ledinghen V, Poynard T, et al. An extension of STARD statements for reporting diagnostic accuracy studies on liver fibrosis tests: the Liver-FibroSTARD standards. J Hepatol 2015;62:807-15.

  14. Bossuyt PM, Reitsma JB, Bruns DE, et al. STARD 2015: An Updated List of Essential Items for Reporting Diagnostic Accuracy Studies. Clin Chem 2015;61:1446-52.

  15. Whiting PF, Rutjes AW, Westwood ME, et al. QUADAS-2: a revised tool for the quality assessment of diagnostic accuracy studies. Ann Intern Med 2011;155:529-36.

  16. Lippi G, Mattiuzzi C. The biomarker paradigm: between diagnostic efficiency and clinical efficacy. Pol Arch Med Wewn 2015;125:282-8.

  17. Lippi G, Mattiuzzi C, Cervellin G. Biomarker validation in the emergency department. General criteria and clinical implications. Emerg Care J 2014;10;1860.

  18. Trenti T, Schünemann HJ, Plebani M. Developing GRADE outcome-based recommendations about diagnostic tests: a key role in laboratory medicine policies. Clin Chem Lab Med 2015. [Epub ahead of print].

  19. Lippi G, Plebani M. Biomarker research and leading causes of death worldwide: a rather feeble relationship. Clin Chem Lab Med 2013;51:1691-3.

  20. Lippi G, Di Somma S, Plebani M. Biomarkers in the emergency department. Handle with care. Clin Chem Lab Med 2014;52:1387-9.

  21. Diamandis EP. Theranos phenomenon: promises and fallacies. Clin Chem Lab Med 2015;53:989-93.

  22. Bates M, Zumla A. Rapid infectious diseases diagnostics using Smartphones. Ann Transl Med 2015;3:215.

 

原文来源:Lippi G, Plebani M. Improving accuracy of diagnostic studies in a world with limited resources: a road ahead. Ann Transl Med 2016;4(3):43. doi: 10.3978/j.issn.2305-5839.2015.11.12

 

相关阅读:

doi: 10.3978/kysj.2014.1.2001

comments powered by Disqus

附件