微信直播

AME循证杂谈014|Meta回归在Stata软件中的实现

Published at: 2015年第1卷第S1期

周支瑞 , 张天嵩
关键词:

一、前言

系统评价中,如果研究间存在异质性,则必需对异质性进行处理,探索异质性来源是处理研究间异质性的重要方法。在实际工作中,Meta回归分析常用来探索研究间异质性的来源及大小,并进一步阐释异质性对Meta分析中合并效应的影响。本文将以张天嵩等主编的《实用循证医学方法学(第2版)》具体实例逐步进行演示,说明Stata软件进行Meta回归分析的具体方法。

Meta回归分析本质上是一种观察性研究,它采用回归分析的方法,探讨某些实验或病例特征(辅变量)对Meta分析中合并效应的影响,以试图明确各研究之间异质性的来源,探讨辅变量对合并效应的影响。Meta回归分析中的辅变量可以是实验干预的剂量、给药途径、疗程、患者的性别、年龄、研究的样本量等各种在研究水平上的一些特征,也可以是单个研究内所包含病例的综合特征,如患者的平均年龄,平均身高等,但并不能采用单个患者的身高、体重等指标作为Meta回归分析的辅变量。对于单个患者的资料,其他的一些统计学方法,如线性回归,logistic回归模型,较Meta回归分析的统计效能更高。

二、Meta回归分析在Stata中的实现

Stata的Meta回归分析命令是metareg,如需安装,则在stata命令窗口中键入:ssc install metareg命令,则可以自动安装在默认目录下。

metareg的命令行操作格式为:

metareg depvar [varlist], wsse(varname)[选择项]

 

其中,depvar:因变量,为每一研究的治疗效应量,一般取logor;varlist为协变量,可选一项或多项;wsse(varname)是不可任意选择的,必须是研究间因变量(depvar)的标准误,且必须大于0。

常用的选择项有:reml:指定用限制性最大似然法(REML)估计(研究间)方差分量τ2,如果不指定permute(),此项为默认;mm:指定用矩法(动差法)估计(研究间)方差分量τ2,当指定permute()时,此项为默认;knapphartung:根据Knapp 和Hartung建议对估计系数的方差所做的修正,用t分布计算P值和可信区间;z:knapphartung法不适用时,选用此法,用标准正态分布计算P值。permute(#):用蒙特卡罗模拟法检验计算p值,处理多重检验时,也可计算最大至最小显著性意义的协变量的P值。#表示指定实行随机模拟的次数,数字越大,P值越精确,但需时较长。

下面以张天嵩等主编的《实用循证医学方法学(第2版)》第6章中关于异质性评价中的数据为例进行实际操作演示。

三、单个协变量(covariate)的Meta回归分析

[实例1]以文献白癜风与HLA-A2相关性的Meta分析中的数据为例,整理成如表1所示,其中,“trnamyr”表示文献作者及发表的年份;“casep”表示白癜风患者中HLA-A2阳性例数;“casen”表示白癜风患者中HLA-A2阴性例数;“ctrlp”表示对照中HLA-A2阳性例数;“ctrln”表示对照中HLA-A2阴性例数; “score”表示研究质量评分;“subject”表示研究对象的数量;“race”表示研究对象的种族;“language”表示研究对象所讲的官方语言。

表1 白癜风与HLA-A2相关性Meta分析的具体数据

trnamyr

casep

casen

ctrlp

ctrln

score

subject

race

Kachru(1978)

23

25

26

81

7

155

Black

Metzker(1980)

31

46

131

331

5

539

Mixed

Minev(1985)

95

40

544

541

4

1220

Asian

Dai(1990)

63

37

50

66

6

216

Asian

Ando(1993)

17

22

256

288

4

583

Asian

Schallreuter(1993)

65

37

190

210

8

502

Caucasian

Venneker(1993)

32

16

359

344

5

751

Caucasian

Valsecchi(1995)

18

15

208

235

6

476

Caucasian

Buc(1996)

51

16

334

426

5

827

Caucasian

Wang(2000)

70

25

52

48

9

195

Asian

Tastan(2004)

22

11

47

53

4

133

Caucasian

 

将上述主要数据按Stata要求输入其数据管理器中,如图1所示。


图1 Stata数据管理器

 

先用metan命令判断研究间有无异质性,为了节省篇幅,我们令metan命令不产生森林图,在命令操作窗口键入:

. metan casep casen ctrlp ctrln, label(namevar=author, yearvar=year) randomor nograph

得结果如下:

 

结果发现:对异质性的χ2检验,P = 0.102,OR值变异对异质性的贡献I2 =37.2%,研究之间的方差分量为Tau2 =0.0493,表明所纳入的各研究之间存在轻度-中度的异质性,需要进行探索异质性来源。接下来,进行Meta回归分析,为避免数据挖掘的情况,我们分别单独针对文献质量评分(score),白癜风家族史的阳性率(family),研究所在地的官方语言及种族进行的Meta回归分析。

在上述meta分析过程中,metan已经给出了OR(变量名为_ES)和其对数的标准误(变量名为_selogES),可以用gen命令产生效应量OR的对数及对数标准误;采用REML法,建立OR值对单个协变量-文献质量评分(score)的回归模型,命令和结果分别为:

. gen logor=log(_ES)

. genselogor=_selogES

. metareg logorscore, wsse(selogor) knapphartung reml

 

 

结果列出了OR对文献质量评分(score)回归系数(Coef.),回归系数的标准误(Std. Err),对回归系数的检验统计量(t)、P值及95%可信区间。发现,其P=0.541,提示与异质性无关。同样地,如果采用REML法,建立OR值对单个协变量-白癜风家族史的阳性率(family)及研究所在地的官方语言的回归模型,此处不赘。笔者计算的结果提示研究质量与异质性无关。

最后,我们探讨种族与异质性的关系。因为种族是分类变量,首先要对其进行哑变量赋值,所用命令为:

.xi: metareg logor i.race, wsse(selogor) knapphartung reml

 

结果提示种族与异质性无关。这个例子说明,即使研究存在异质性,进行Meta回归分析也不一定能找到异质性来源。

四、多个协变量(covariate)的Meta回归分析

[实例2]为了便于说明使用方法,应用网络的数据作为实例。通过如下Stata命令:usehttp://fmwww.bc.edu/repec/bocode/m/metan_example_data获得数据,为了避免数据挖掘的影响,预先采用研究设计和研究发表年份等临床研究特征为复合变量,整理数据如图1,其中study_id表示研究名称;study_type表示研究设计类型,0表示队列研究,1表示病例对照研究;year为研究发表年限;ntdeath和ntnodeath分别表示治疗组死亡及未死亡人数,ncdeath和ncnodeath分别表示对照组死亡和未死亡人数。取OR为效应指标进行meta回归分析。

 


图2:Stata数据管理器中显示的每个研究的临床特征及数据

 

命令窗口键入以下以命令:

. metan ntdeath ntnodeath ncdeath ncnodeath,label(namevar=study_id) random or nograph

得数字化结果如下:

 

从异质性检验结果可以发现:对异质性的χ2检验,P = 0.026 < 0.1,OR值变异对异质性的贡献I2 =41.9%,研究之间的方差分量为Tau2=0.0742,表明所纳入的各研究之间存在异质性,需要进行探索异质性来源。

接下来,按下列命令,分别以研究类型和发表年限为协变量,采用REML法,建立OR值对单个协变量的回归模型:

. gen logor=log(_ES)

. genselogor=_selogES

. metareg logorstudy_type, wsse(selogor) knapphartung reml

. metareg logoryear, wsse(selogor) knapphartung reml

分别得数字化结果如下:

 

按上述单个协变量的Meta回归分析,OR值对研究设计的回归模型结果发现其P=0.002,表明研究设计是研究间异质性来源之一,将其引入meta回归分析模型后,研究间的方差分量由0.0742降为0.0167,表明可以解释其77.5%的异质性来源;OR值对发表年限的回归模型结果发现其P=0.409,提示发表年限与研究间异质性无关。

接下来做多个协变量的meta回归分析,假设采用REML法,将研究设计和发表年限两个协变量均纳入meta回归模型,则其命令为:

. metareglogor year study_type, wsse(selogor) knapphartung reml

得数字化结果如下:

 

结果解读:将两个复合变量引入回归模型后,研究间的方差分量由0.0742降为0.0107,表明可以解释其86.4%的异质性来源。这个例子说明,Meta回归分析不可能充分解释所有的异质性,允许剩余异质性的存在。

 

五、 结语

Meta回归属于meta分析的高级统计学方法部分,对Meta回归的理解程度取决于对统计学中关于“回归”的理解程度,本文在参考了《实用循证医学方法学(第2版)》基础上给大家演示了Stata软件实现meta回归的过程,希望能对大家有所帮助。

六、主要参考文献

[1]张天嵩,钟文昭,李博.《实用循证医学方法学》(第2版),中南大学出版社,2014.

作者简介

周支瑞,复旦大学肿瘤医院放疗科在读博士。AME学术沙龙委员,喜读书,广交友。业余时间担任丁香园循证医学讨论版版主,自学临床流行病学与循证医学五年余。主要研究方向:恶性肿瘤放射治疗与放射生物学研究、循证医学与Meta分析方法学研究。目前以第一作者及共同作者发表SCI论文十余篇,参编学术著作两部。

 

张天嵩,医学博士,主任医师,上海中医药大学兼职教授,潍坊医学院硕士生导师;上海市中西医结合学会循证医学专业委员会委员,上海市中西医结合学会心身医学专业委员会委员,上海市中医药学会呼吸分会委员,中华中医药学会学术流派研究专家委员会委员,中国中西医结合学会儿科分会青年委员;《中国循证医学杂志》第六届编委会委员;《中医杂志》、《中国中医药信息杂志》、《循证医学》、《中南大学学报(医学版)》等杂志审稿专家。擅长内科常见病、多发病、疑难病的中西医结合治疗;对循证医学方法学、数据挖掘、医学统计等方面造诣颇深。主持和以主要研究者参与上海市卫生局、上海市科委等研究课题8项,目前在国内外医学期刊已发表学术论文百余篇;主编、合著、参加编写和翻译医学著作10部,主编《实用循证医学方法学》第1版、第2版。

AME循证杂谈专栏

 

01 走出循证医学的八大误区

02 临床医生该如何高效的检索?

03 系统评价哪家强?

04 正确认识系统评价/meta分析在医学科研和临床实践中的作用

05 何为一篇好文章?

06 随机对照试验中那些真假难辨的亚组分析

07 随机对照试验的批判性阅读

08 系统评价的idea从哪里来?

09 顶级医学杂志发表什么样的meta分析?

10 如何画出人生第一张森林图?

11 亚组分析在meta分析中的应用

12 如何用图形完美展示临床研究中亚组分析的结果

13 随访资料的生存分析-基于Stata软件的统计学实现

14 Meta回归在Stata软件中的实现

 

点击阅读原文,查看上期图文信息!

comments powered by Disqus

附件