卡方检验及其错误应用——有“率”未必“卡方”

2019-06-13 冯国双 小白学统计

有不少临床工作者,提“率”必“卡方”,似乎卡方检验是分析“率”指标的万能工具,也有的人只要看到分类资料,一律用卡方检验。事实上,不同的研究目的、资料类型所采用的方法是各不相同的。卡方只是其中之一,但绝不是全部。换句话说,卡方检验可以比较两组或多组的分类资料,但分类资料的比较不一定非要用卡方检验。本文主要针对目前论文撰写中常见的一些卡方检验的错误应用进行分析,并给出正确的分析思路。一定要区分“分

有不少临床工作者,提“率”必“卡方”,似乎卡方检验是分析“率”指标的万能工具,也有的人只要看到分类资料,一律用卡方检验。事实上,不同的研究目的、资料类型所采用的方法是各不相同的。卡方只是其中之一,但绝不是全部。换句话说,卡方检验可以比较两组或多组的分类资料,但分类资料的比较不一定非要用卡方检验。

本文主要针对目前论文撰写中常见的一些卡方检验的错误应用进行分析,并给出正确的分析思路。

一定要区分“分组”和“结局”

以前有的统计学书中,经常这么说:行变量是无序、列变量是有序的情形用某某方法,行变量是有序、列变量无序用某某方法,等等之类的。很容易让人糊涂,什么行和列?我的行列跟你的行列一样吗?作为初学者,经常晕晕乎乎的搞不懂。

其实,比较简单的方法是这样:分清楚哪个是分组变量,哪个是分析变量(结局)就行了。这个比较好区分,根据你的研究目的就行了。比如你要比较两种药物的疗效,那很明显,疗效是结局,药物是分组。再比如,比较男女间某病发病率,那么性别就是分组,是否发病就是结局。

只要你能分清分组和结局,就很容易选择方法。其实在分类资料的比较重,分组是什么资料并没有关系,重要的是结局资料的类型。且看下面的图形。

分类结局组间比较的方法选择

首先一定要明确,分类资料主要有三种类型:二分类、无序多分类和有序多分类。对于不同的类型,组间比较方法是不同的,绝不是卡方检验一家独大,更需要结合实际情况来判断。下图是常见的分类资料组间比较的方法。



不难看出,对于分类资料的组间比较,统计方法的选择主要跟结局指标类型和研究设计有关,跟分组变量的类型没什么关系。你的分组变量是无序也好,有序也好,都无所谓。只跟你的结局变量的类型有关,你的结局变量是有序或无序,那就有影响了。

如果结局是二分类或无序多分类变量,一般直接用χ2检验即可,随机设计用普通χ2检验,配对设计用McNemar配对χ2检验。

对于有序多分类结局,通常采用秩和检验,以比较各组不同程度上的等级差异。如果采用χ2检验的话,只能说明组间构成比是否有差异,体现不出“有序”变量的价值所在。

即使对于二分类资料和无序分类资料,χ2检验也并非唯一选择。当两组或多组的分类资料比较时,只有在总例数大于40且理论频数均大于5时,才选择χ2检验;如果总例数大于40但有理论频数小于5且大于等于1时,最好选择校正的χ2检验;如果总例数小于40或理论频数小于1,建议采用Fisher确切检验,此时如果用χ2检验容易出现假阳性。

事实上,也有一些统计学家建议,保险起见,你可以所有的情形都用Fisher确切检验。

更多内容,可查看医咖会系列教程:

1、SPSS教程:两个率的比较(卡方检验)及Fisher精确检验

2、Stata教程第13期:卡方检验/Fisher精确检验

3、SPSS教程:多个组比较(Fisher精确检验)及组间两两比较

有“率”未必卡方

先看一个例子:某研究调查了4所高中,测量了男生和女生的脂肪比例情况,比较男女的脂肪比例差异。该研究在统计学方法部分写道:“比例的比较采用χ2检验”。

不少人可能会说,没问题啊。比例嘛,当然采用卡方了。对此,我只能用陆游的一首词来回答:错!错!错!

通常我们所说的比例,是指总人群中,具有某种特征的人所占的百分比,如调查了某高中男生和女生的饮酒比例分别为10%和6%,这里的结局指标并不是比例,而是分类资料(饮酒和不饮酒),比例只是作为每类中的频数,这种情况下,性别间的比较可以考虑χ2检验。

而在这一例子中,观察的结局指标就是比例值,每个人都有一个比例值,这一比例值并不能作为分类资料看待,而是连续资料,其单位是%。对于每组人群(男和女),可以计算平均的脂肪比例,因此其比较应该采用定量资料的比较方法(如t检验、秩和检验等)。

率的两两比较

另一个在实际应用中需要注意的问题是,对于多组率或比例的比较,当卡方检验结果显示P<0.05时,仅表示多组之间总的有差异,即多组中至少两组有差异,但无法说明具体哪两组之间有差异。如果要了解具体哪两组间不同,此时可进行两两比较。

常用的两两比较方法是Bonferroni法,该法主要思想是校正检验水准,即根据比较次数的多少将将检验水准改为 0.05/比较次数,计算的P值与校正的检验水准进行比较,做出统计学结论。例如,对4组进行两两比较,共需比较6次,此时需要将检验水准调整为0.05/6=0.0083,两两比较时,当P值小于0.0083才认为组间差异有统计学意义。

注意配对卡方结果的选择

配对卡方和两组独立资料的卡方,结果是不同的。在很多软件中,不少人往往会选择错误,误把独立资料的卡方结果作为配对卡方的结果来展示。

对于配对的分类资料,一般软件给出的是McNemar配对χ2检验,所以,当你看到McNemar字眼,这是配对卡方的结果,即指标前后差异的结果。但是要注意,一般软件也会同时给出普通χ2检验的结果,但此时普通卡方检验的结果给出的是相关性检验结果,即配对前后指标是否有关联。这两个结果不可混淆,否则容易给出相反的结论,因为这两个结果经常不一致。

注意等级资料的结局

如果结局是等级资料,一般都会建议不要用卡方检验,而是用秩和检验。这并不是说等级资料结局不能用卡方,等级资料也可以用卡方检验,但是,这时候等级资料就失去了等级的意味了。也就是说,你可以对等级资料结局采用卡方检验,但是说明的问题就不同了。

用秩和检验,说明的问题是,两组或多组之间有等级或程度上的差异;而如果用卡方检验,只能说明,两组或多组的构成比有无差异,注意构成比是没有等级或顺序的,体现不出等级资料的特点。

我想,既然你的结局考虑用等级资料,肯定是想体现出等级的特点,否则那为什么要设等级资料呢?所以,我们一般都建议,等级资料的结局,组间比较最好采用秩和检验,而不是卡方检验。

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (2)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=368067, encodeId=66ba36806e6f, content=其中的区别很大,怎么用好。课题设计是关键。, beContent=null, objectType=article, channel=null, level=null, likeNumber=60, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=67182624830, createdName=敢心, createdTime=Thu Jun 20 16:43:57 CST 2019, time=2019-06-20, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1599778, encodeId=d53b1599e7878, content=<a href='/topic/show?id=3e76365110a' target=_blank style='color:#2F92EE;'>#卡方检验#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=44, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=36511, encryptionId=3e76365110a, topicName=卡方检验)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=eb2618750443, createdName=ycmayy, createdTime=Sat Jun 15 13:52:00 CST 2019, time=2019-06-15, status=1, ipAttribution=)]
    2019-06-20 敢心

    其中的区别很大,怎么用好。课题设计是关键。

    0

  2. [GetPortalCommentsPageByObjectIdResponse(id=368067, encodeId=66ba36806e6f, content=其中的区别很大,怎么用好。课题设计是关键。, beContent=null, objectType=article, channel=null, level=null, likeNumber=60, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=67182624830, createdName=敢心, createdTime=Thu Jun 20 16:43:57 CST 2019, time=2019-06-20, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1599778, encodeId=d53b1599e7878, content=<a href='/topic/show?id=3e76365110a' target=_blank style='color:#2F92EE;'>#卡方检验#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=44, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=36511, encryptionId=3e76365110a, topicName=卡方检验)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=eb2618750443, createdName=ycmayy, createdTime=Sat Jun 15 13:52:00 CST 2019, time=2019-06-15, status=1, ipAttribution=)]

相关资讯

卡方检验—Cochran Armitage趋势性检验

初见CATT Cochran-Armitage趋势性检验(CATT),是以William Cochran(1954)和Peter Armitage(1955)的名字来命名的,可用来评估一个二分类变量和一个有序分类变量之间的关联性,即R×2列联表资料,因此又称趋势性卡方检验。 使用条件 分组变量为有序变量,至少分为三类 结局