微信直播

倾向性分析的应用和统计学处理方法(上):倾向性分析案例剖析

Published at: 2015年第1卷第S1期

关键词:

选自即将面世新书《疯狂统计学》第16章第1节 

作者/ 王晓燕 胡志德 李潇

倾向性分析的应用和统计学处理方法

第1节:倾向性分析案例剖析

第2节:倾向性分析的统计学处理方法

引言

临床研究中,对某一干预措施疗效和安全性的证据多来自于随机对照试验(RCT)。由于采用了随机分组的方案,因此试验组与对照组除干预措施外的其它变量在理论上是均衡的,这就保证了入选患者的预后差异仅来自于试验因素。RCT目前是评估干预措施有效性和安全性的最理想研究方案,但是RCT研究投入成本和对参研中心的资质要求较高,严格的纳入和排除标准使得入选患者无法代表“真实世界”人群的特征。更重要的是,某些研究会因为伦理学问题而无法通过RCT来予以论证(比如:戴安全套是否会降低HIV感染风险)。因此部分对干预措施疗效的研究仍然是基于观察性研究,特别是前瞻性队列研究和病例-对照研究。其中,前瞻性队列研究可以采用连续入组的方法招募研究对象,且可以在很大程度上保证研究对象的特征清晰,因此保证了研究对象的代表性和数据的完整性,其论证强度要高于回顾性的病例−对照研究。然而,观察性研究的缺陷在于存在较多的混杂因素,干扰了干预措施和预后之间的关系。为了排除混杂因素对研究结论的影响,研究者需要进行多参数的统计学分析(比如logistic回归和Cox风险比例模型),校正混杂因素对疾病预后的影响。但是这些校正方法的不足之处在于:当变量较多或患者数量较多时,多因素回归模型可能出现过度拟合,且有时需要假定暴露因素的强度和疾病结局之间存在线性关系,因此对结果的解读需要十分谨慎。

倾向性分析是近年来新发展起来的一种统计学方法,目前越来越被广泛运用于预后研究。该法根据每位患者各变量数据计算出患者的倾向值(PropensityScore, PS),并根据倾向值对病人进行配对,已校正混杂因素的干扰,减少了过度拟合的可能性。本章节以发表在Journal of Thoracic Disease上的一篇倾向性分析为例,探讨倾向性分析在病例 −对照研究中的应用、统计学处理的方法。关于倾向匹配分析的统计学原理,可以参与《聪明统计学》第八章的内容。

这项研究旨在评估贫血是否是冠状动脉介入术 (PCI)术后患者的独立预测因素,同时评估贫血患者 PCI术后的长期预后。论文全文可以至Journal of Thoracic Disease网站上免费下载,链接为:

http://jtd.amegroups.com/article/view/5819/pdf

第1节 倾向性分析案例剖析

1 总体设计思路

本篇文章为病例 −对照研究,分析贫血是否是 PCI术后不良预后的独立预测因素。之所以选定贫血这一因素,是因为笔者在阅读文献时发现,多篇文献报道在心血管疾病患者中,贫血可增加缺血事件 (血栓事件、心梗、血运重建、缺血性卒中、心性死亡等 )风险,改善贫血可降低缺血事件发生率,显著改善患者预后。而 PCI术后患者由于冠脉支架植入后内皮细胞愈合慢、支架异物反应以及动脉斑块不稳定等因素,是心血管疾病患者中缺血事件高危人群,因此识别 PCI术后患者中缺血高危人群,对于临床医生制定个体化诊疗方案,防治缺血事件具有指导价值。

从病理生理角度分析,贫血是可能增加 PCI术后患者的缺血风险的,首先,贫血患者血红蛋白浓度下降,血含氧量下降,从而导致心肌细胞氧供和氧耗失衡,心肌细胞缺血;其次,心肌细胞缺血之后,反射性引起交感神经和血管紧张素醛固酮系统激活,导致心率和血容量代偿性增加,心率和血容量增加又会造成心脏负荷增加,加剧心肌缺血;再次,慢性贫血导致心肌缺血之后,交感神经和血管紧张素醛固酮系统激活可导致心肌肥大和心室重塑,而心肌肥大又会进一步加剧心肌细胞缺血;此外,还有研究显示,贫血患者血管炎症增加,炎症可加剧冠状动脉斑块的不稳定以及血栓形成。

那么,贫血是否是 PCI术后患者长期缺血事件的独立预测因素呢?此前也有部分研究对 PCI术后的贫血及非贫血患者预后进行分析,结果显示贫血患者PCI术后缺血事件风险均显著高于非贫血患者。但是这些研究均为回顾性分析,且未排除混杂因素对患者预后的影响,因此有必要使用倾向性分析明确“贫血”对PCI术后患者的影响。

2 统计学处理思路

本篇文章,作者利用2008—2012年间的PCI患者数据库进行分析,分析内容包括两部分:①研究对象基线特征(包括倾向性匹配前和倾向性匹配后);②贫血与长期缺血事件的关系。

在本文中,作者首先将入选患者按照有无贫血病史,分为贫血组与非贫血组,比较贫血组与非贫血组人群的基线资料,正态分布计量资料的比较采用独立样本t检,偏态资料之间的比较采用Mann-Whitney U检验。分类变量中,二分类变量(如性别、有无吸烟病史等)采用卡方检验进行比较,如分类变量之间存在等级关系(如患者心功能按照NYHA分级分为1、2、3、4等4个等级),则采用秩和检验比较。这一步是倾向性匹配之前的贫血与非贫血组患者基线资料的比较(见表16-1)。

之后作者对贫血组与非贫血组患者进行倾向值匹配,以使两组之间除“贫血”这一观察指标外,其它因素均保持均衡。如表16-1所示,在进行匹配之前,研究对象中581 人发生了贫血,8 244 人未发生贫血,贫血病人与非贫血病人的绝大部分临床特征( 如性别、年龄、体重指数、吸烟史等) 之间均存在统计学差异。采用倾向匹配法之后,共有436 例贫血患者找到了能与之匹配的非贫血患者。由表16-1 可见,匹配之后贫血与非贫血患者之间各特征保持均衡。

表16-1 倾向值匹配前后的患者基线资料(贫血组 vs. 非贫血组)

第一部分数据展示之后,作者进一步分析了贫血与PCI 术后患者预后之间的关系。这一部分又包括两部分:①评估贫血患者长期不良事件发生率是否显著高于非贫血患者;②评估贫血是否是PCI 术后患者不良预后( 缺血事件、全因死亡、主要心血管不良事件) 的独立危险因素。由于本篇文章是评估贫血与远期预后之间的关系,因此作者先用Kaplan-Meier 法描述暴露因素的预后价值,然后再以Cox 模型来评价暴露因素的预后价值。这里需要强调,如果是评价贫血与近期预后之间的关系,其统计学方法一般是采用受试者工作特征(ROC) 曲线法和多元logistic 回归。关于近期预后和远期预后统计学方面的差异,本书其它章节已有详细阐述。

本项研究的主要观察终点是PCI 术后3 年缺血事件( 包含心肌梗死、缺血性卒中、靶血管血运重建) ,次要研究终点是PCI 术后3 年死亡及主要心血管不良事件(MACE ,包含全因死亡、非致死心梗、靶血管血运重建) 。首先,倾向性匹配之后,K-M 曲线分析显示,贫血组患者PCI 术后3 年缺血事件发生率为41% ,非贫血患者的3 年缺血事件发生率为19.3% ,两组之间具有显著统计学差异( 图16-1) 。事实上,两组之间缺血事件发生率从PCI 术后200 天开始便已经具有统计学差异。

图16-1 PCI术后患者3年缺血事件Kaplan-Meier曲线

此外,贫血组患者PCI 术后3 年死亡率和MACE 事件也均显著高于非贫血患者( 图16-2) 。

之后作者利用Cox 回归模型分析了倾向性匹配前后,PCI 术后3 年缺血事件、3 年死亡事件以及3 年MACE 事件的独立预测因素。纳入Cox 分析的变量为单因素分析中P <0.05 的变量或结合参考既往文献报道中有意义的变量。

表16-2 为本文Cox 模型分析结果,从中可以看出,匹配前后,贫血均为3年缺血事件、3 年死亡事件以及3 年MACE 事件的独立预测因素(表16-3~表16-4)。

此外,我们可以看到,匹配之前,多个因素与患者3 年缺血、死亡或MACE事件相关,但匹配之后,独立相关因素数目减少。以缺血事件为例,匹配之前,贫血、老年、糖尿病病史、心脑血管疾病病史、病变血管支数、完全血运重建与患者的预后独立相关;匹配之后,仅有贫血、心脑血管疾病病史、完全血运重建等3 个因素与患者的预后独立相关( 其中贫血、心脑血管疾病病史对应的风险比(HR) 值均>1 ,为危险因素;完全血运重建对应的HR 值<1 ,为保护因素) 。

3 倾向性分析的优势和不足

倾向性分析的优势体现在以下三个方面:①控制暴露组( 干预组) 和对照组之间其它混杂因素的影响,在一定程度上保证两组之间的可比性;②与传统多因素回归模型相比,因为对所有入选患者均进行倾向值得分,并最终根据倾向值得分情况进行匹配,在一定程度上减少了过度拟合。

图16-2 (A)PCI术后患者3年死亡事件Kaplan-Meier曲线;(B)PCI术后患者3年MACE事件Kaplan-Meier曲线

表16-2 倾向性匹配前后PCI术后3年缺血事件独立预测因素

表16-3 倾向性匹配前后PCI术后3年死亡事件独立预测因素

但是倾向性分析并非完美无缺,作为一种统计学方法,它的不足之处主要体现在以下两点:第一,通过筛选后进行匹配的对象不一定能代表原有的研究对象。比如在原文中列举的贫血对接受PCI 治疗的患者远期预后的影响中,在进行匹配前,贫血患者共有581 例,非贫血患者共有8 244 例,进行匹配后,贫血和非贫血患者均为436 例,虽然两组患者的特征具有了可比性,问题是:筛选到的436 例贫血患者是否还能代表16~581 例原有的研究对象?有的读者可能会认为样本代表性问题不是一个大问题,但实际上这个问题十分重要,因为样本来源问题直接决定了研究结论的“外推性”。临床研究一方面固然要讲究科学性( 保证结论的稳健性) ,另一方面还得保证具有良好的外推性( 能推广到临床应用) 。只有来源于真实世界的研究,才能更好地指导真实世界。而来源于虚拟世界的研究结论,有时不一定能在真实世界中得到验证。经过筛选后的研究对象是否能反映真实世界,就不好一概而论了。第二,PSM 无法做到“剂量依赖性分析”。也就是说,PSM 开展的前提是根据暴露因素可以将研究对象分为暴露组和非暴露组,比如原文中贫血组和非贫血组。但是很多情况下,还要研究暴露强度与结局事件的关系,以增强研究的说服力,此时,PSM 就无能为力了。比如:如果研究目的不是“贫血是否影响接受PCI 患者的远期预后”,而是“PCI 患者的远期预后是否随着血红蛋白浓度的增加而改善”,这时就不能用PSM 了,最好还是采用经典的Kaplan-Meier 曲线和Cox 模型。

表16-4 倾向性匹配前后PCI术后3年MACE事件独立预测因素

comments powered by Disqus

附件