微信直播

AME统计022|戏说卡方检验(二)

Published at: 2015年第1卷第S1期

四叶草
关键词:

编者按:上周我们已经了解了卡方检验的目的、卡方值以及卡方检验的自由度(点击查看前期内容)。今天,虫哥将继续为我们戏说卡方检验,从何说起呢?且听虫哥娓娓道来。

1、卡方检验解读三步法

卡方检验解读三步法:对于卡方检验,有的朋友最关心的就是 P 值大小,一旦 P<0.05 就大笑三声扬长而去,其实卡方检验结果解读要分为三步,第一步是统计学解读,看 P 值,如果统计学解读没有意义,通常专业解读意义就不大。而在统计学有意义的情况下就要进一步看看专业上是否有意义。因为在卡方检验中 P 值的最根本的意义就是试验组上的差别把它推广到整体其仍然成立的概率。即使差别很小,如果实验组的样本量够大也能得出有统计学意义的 P 值。所以当统计学有意义后,我们更要注意这个结果在专业上有没有什么意义。第二步:专业上如何选择分组变量和指标变量。因为四格卡方检验,从统计上横向解读和纵向解读都是可以的,而且它们共享同一个卡方值和 P 值,但不同方向专业含义不同。我们要从研究目的出发去选择哪一组作为分组变量,哪一组作为指标变量。比如本例(表1)在横向上你可以解读成男性组和女性组治疗的有效率(或者无效率)有没有区别,因此分组变量男性组和女性组,指标变量为有效、无效。在纵向你可以解读成不同治疗效果之间男女的构成比有没有差别,因此分组变量为有效组和无效组,指标变量为男性、女性构成比。当然,后一种试验设计思路是比较少用的,但不等于不能用。举个例子。苹果公司生产白色和黑色两种 iPad,研究者随机选择购买白色和黑色各 100 例用户,想看看男性和女性两种用户对这两个颜色的选择是否有差异,那是不是就要用后面一种设计方案。第三步,专业意义的解读。比如一种新药对某种疾病治愈率 81%,而对照的老药治愈率 80%,即使这个时候 P 值 <0.05,在专业上也是没有什么意义的。

表1:某药物在男性组和女性组治疗效果的差别

 

2、普通四格表和配对四格表一样吗?

讲到四格表,就不得不提四格表的另外一种形式——配对四格表。配对四格表和我们普通四格表最本质的区别在哪里?我们还是通过一道例题来说明。如表 2,某研究用将受试者同一管血液标本用 A 方法和 B 方法测乙肝表面抗原,阴性和阳性人数如下表所示,问这两个方法有没有区别?

表2:两种方法检测乙肝表面抗原的配对四格表

表3:两种方法检测乙肝表面抗原的还原成普通四格表

这个数字和表 1 完全相同,有些朋友脑筋转的很快,这个太简单了,不用电脑软件,我手工就可以计算,就用前面公式 x2=(ac-bd)2n/(a+b)( b+c)(c+d)(a+d) 得 x2=12.86 自由度 =1,查表 P<0.01。不好意思,错了。注意看,这种四格表体现不出分组变量和指标变量关系,它们纵、横属性是一样的,都是对同一样本的评价结果。我们把它还原成经典四格卡方检验四格表(如表 3):A 阳性不是 99 例,因为 A(阳性)B(阳性)和 A(阳性)B(阴性),都属于 A 阳性,这样看来 A 方法阳性应该是 99+75=174 例。同理 A 阴性 26 例,B 阳性 104 例,B 阴性 96。经过这样还原,纵横之间属性就不一样,就可以分解成分组变量和指标变量,这样才能用公式 x2=(ac-bd)2n/(a+b)( b+c)(c+d)(a+d) 得 x2=57.79 自由度=1,查表 P<0.01。当然用这种方法可以做,但是配对四格表有专门针对他的简化公式 x2=(b-c)2/(b+c),注意这时 b 和 c 就是表 2 指配对四格表中的 b 和 c。结果为(5-75)2/(5+75) =61.25,咦,两个计算结果卡方值不一样,我们前面说过了,卡方值越大越好,因为 P 值越小。看来用配对的方法做要高效一些,更容易出结果,因为配对后同一个人的血查两次,减少了误差。如果按不配对做法所以实际样本数是 400,翻一倍。注意:配对设计的,你可以用普通卡方去算,只是降低你的效率;但是不配对设计,因为达不到配对检验的条件,就不能用配对公式。

3、kapa 分析与配对卡方检验——看似矛盾的两种方法

图1:阳性率相同情况下,kapa 分析不同组合结果不同的示意图

说到配对四格表,也就不得不说配对四格表另一种作用,Kapa 分析,也就是一致性检验。有一些朋友在这里可能拐不过弯。比如我用配对四格表卡方检验,P<0.01,说明两个方法差别有明显统计学意义,不就是说明它们不一致吗?为什么还要用 Kapa 分析?同样,如果我做出来 P=0.90,说明两种方法区别没有统计学意义,说明它们挺一致的,为什么再 Kapa 分析?下面我们用一道简单的例子来解释这个问题。抽取 20 个人血清,用 A 方法检查有 10 个乙肝抗原阳性,用 B 方法检查也有 10 个乙肝抗原阳性,问这两种方法检出乙肝阳性率区别有没统计学意义,再问这两种方法一致性有没区别?对于第一个问题,二者检出率都是 50%,这种情况不用做卡方检验都知道检出阳性率肯定没区别。对于第二个问题我们不能因为卡方检验没区别,就认为一致性很好,我们看图 1,同样阳性率为 50%,在(1)中两种方法完全一致,kapa 系数=1;在(2)中完全不一致,kapa 系数=-1;在(3)中一半一致一半不一致,kapa 系数=0;在(4)大部分一致,kapa 系数=0.6。这样大家就理解配对卡方和 kapa 分析说的是两码事,卡方说的是率的差别,kapa 说的是一致不一致,即使率相同,从图 1 可以看出 kapa 分析的结果还有很多的可能,要看配对四格表具体数值。抽象一点的数理上的理解,配对四格表计算 x2=(b-c)2/(b+c),它更关注 b、c 两个格子的结果,而 b、c 两个格子代表两种方法结果不一致。kapa 系数的计算公式为 (Po-Pe)/(1-Pe),其中 Po=(a+d)/n, Pe=[(a+b)(a+c)+(c+d)(b+d)]/n2,它更关注 a、d 两个格子的结果,而 a、d 两个格子代表两种方法结果一致。

 

图2:卡方检验 statistics 下的不同选项示意图

 

这样看来,相同的四格表数值,可以理解成普通四格表,配对四格表,kapa 分析,其结果各不相同。如果录入完丢给 SPSS 软件,软件肯定蒙圈了,它不明白你要它干什么。如果软件把三个结果都统统输出来,我们也会蒙圈了,因为结果太多了。所以录入好四格表后肯定要告诉 SPSS 软件我们要干什么,如图 2 所示。但是这个我们不能乱勾选,把普通四格表勾选成配对、或把配对勾选成普通四格表或 kapa 分析,其结果都是错的,我们要从表格所代表的专业意义出发来选择。

 

4、四格卡方检验的几个注意事项

最后谈一谈四格表卡方检验注意事项:

  1. 对于总样本量小于40的一定要用 Fisher 精确检验。

  2. 对于 P 在 0.05 左右的一定要改用 Fisher 精确检验。

  3. 对于出现某一格理论频数(T)小于 1 的一定要改用 Fisher 精确检验。

  4. 对于出现 1≤T <5 时用校正卡方检验。

     

Fisher 精确检验和校正卡方检验我们不必去记它的公式,只要懂得适用情况就行。这些统计量在 SPSS 结果部分都有显示,将在下一节做介绍。

介绍完四格卡方检验,我们要进一步介绍 R×C 列表的卡方检验。R×C 列表的卡方检验的卡方检验往往争论比较多,主要是因为它的形式比较多样,容易混淆和错用。

了解完四格卡方检验,下一期虫哥将和大家一起认识更加多姿多彩的R×C列表卡方检验,下一期一定更加精彩,我们不见不散!

doi:

10.3978/kysj.2014.1.1195
comments powered by Disqus

附件