论文中方差分析的常见误用

2019-07-01 冯国双 医咖会

这一篇结合本人的一些审稿经历,简单总结一下论文发表中常见的一些方差分析的错误情况,希望能对临床医生有一定帮助。众所周知,方差分析比较常用的场合就是多组定量资料的比较,而在应用中的主要几个问题有:a. 缺乏对数据的正态性检验,组间比较都采用方差分析,而不考虑秩和检验。b. 两两比较直接采用t检验,而不是专门的两两比较方法。c. 采用方差分析处理重复测量资料,增加假阳性错误。d. 实验设计考虑不周,误

这一篇结合本人的一些审稿经历,简单总结一下论文发表中常见的一些方差分析的错误情况,希望能对临床医生有一定帮助。

众所周知,方差分析比较常用的场合就是多组定量资料的比较,而在应用中的主要几个问题有:

a. 缺乏对数据的正态性检验,组间比较都采用方差分析,而不考虑秩和检验。

b. 两两比较直接采用t检验,而不是专门的两两比较方法。

c. 采用方差分析处理重复测量资料,增加假阳性错误。

d. 实验设计考虑不周,误用其它设计的统计分析方法。

第一种错误比较明显,也都谈了好多年了,应该说是老生常谈的一个错误,只要大家有心,就不会犯这种明显的错误。前几天有人问我说:是不是组间比较前一定要做正态性检验,我看到好多人都没有做啊,都是直接就用方差分析。

这里就这个问题谈下个人观点。理论上,一定要做,别人不做,有两种可能,一是做了,只是没有在自己的结果中提及而已;二是真的没做。

可能有的人觉得无所谓,不就是个正态性检验吗,提得多了都烦了。但是前提条件这种东西,一定要有的。否则就失去采用方法的意义了。有时候,有的指标,可能比较明显,肯定是正态,比如身高、体重等,可能你不提也没事。但是从稳妥的角度,建议还是只管提一下。其实做了也就是一分钟的事,文章中加上一句满足或不满足正态的话也不累赘,何苦不做呢?

第二种错误也是翻来覆去说了多少年了。两两比较不能用t检验,而要用两两比较的方法。而且两两比较方法的选择(方差分析后的两两比较方法太多了,该怎么选择?)在前面的文章中也有介绍了,所以这种错误案例我也不举了。其实还是有很多。

下面主要通过2个例子来说明一下第三种和第四种错误。

例1

某研究欲分析某药物对骨质疏松的治疗效果,该研究将24只小鼠分为3组,第1组为正常对照组,第2组应用常规药物(A),第3组联合应用常规药物和该新药(A+B)。研究者对观测结果分析后,发现第3组和第2组之间差异有统计学意义,结论认为新药对治疗骨质疏松有效。

笔者分析:这个例子在前面文章中曾提到过,但是当时没有从专业上解释的详细。应该说,这种形式的设计在临床中不在少数。这里从专业上再说一下。这种研究涉及两个因素,每一因素各有2个水平,分别为常规药物(A)使用和不使用、新药(B)使用和不使用,因此两个因素组合后为4种处理。

该研究中第3组比第2组多了B药,作者将两组的差异归因于多增加的B药的效果,认为新药对治疗骨质疏松有效,这一结论还是值得商榷的。因为如果A和B之间有交互效应的话,第3组就不仅包含B的作用,而且有A、B之间的交互作用。

两组有差异可能是因为B的作用,也可能是因为A和B的交互作用。因此除非确定A和B之间完全独立,否则不能下结论认为两组差异是由于增加了B药造成的。

建议:该研究更好的做法是增加一组单独新药(B)组,这样就形成一个2×2的析因设计,然后采用析因设计的方差分析,既可以检验A和B的主效应,也可分析二者的交互效应。如果交互效应有统计学意义,可以提供更多的信息。

例2

某医院欲探讨准分子激光原位角膜磨镶术(LASIK)对患者视野的影响,对实施LASIK的46例近视患者分别于术前、术后1天、1个月、3个月、6个月用Humphrey 视野计30-2SITA快速阈值检测程序行视野检查。该研究采用随机区组设计的方差分析, 分析各时间点视野指数是否有统计学差异。部分分析结果列于下表。



笔者分析:该研究比较有代表性,目前临床中有不少类似研究,即对同一群患者施加干预后分别观察疗前和疗后不同时间点的指标值。在以前通常将此类设计归为随机区组设计中,将个体作为区组因素,时间点作为分组因素,统计分析采用随机区组方差分析。

甚至在我当年读本科的时候,依然是这么讲的,作为随机区组设计。但大家慢慢发现,此类设计作为随机区组并不合适。为什么呢?在随机区组设计中,每一区组中的处理是随机分配的,也就是说,区组中的样品理论上是可以调换的。而本例研究中,时间点是无法随机分配的,只能是依次观察。你没有办法让明天挪到今天的前面去,这一点决定了他们还是有不同的。所以不能混为一谈。

建议:由于同一研究对象的多次观察之间很可能具有一定的相关性,采用重复测量方差分析更为合适一些。重复测量方差分析目前已经在国内用的越来越多了,不像以前只会用普通的方差分析。

当然重复测量方差分析要稍微复杂一丁点,但是并不是特别复杂,但是它能说明很多问题,比如发展趋势问题,时间点的比较等等,都可以做到。关于重复测量方差分析会在后面文章中专门介绍。这里只是先简单提点一下。

总之,方差分析就跟t检验一样,看起来简单,用起来并不然。尤其方差分析涉及的内容更多,设计类型也更多,这就注定了它一定要比t检验复杂一些。真正用对的话,需要考虑很多方面,如设计类型、数据分布、两两比较、独立性等。方差分析是十分常用的,所以记住一些典型的错误案例,尽量在应用中避免这些错误,还是很有必要的。

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=369374, encodeId=c7fb3693e4bd, content=不错,谢谢分享, beContent=null, objectType=article, channel=null, level=null, likeNumber=68, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=0ccf1815072, createdName=ms3008351449862449, createdTime=Tue Jul 09 23:49:00 CST 2019, time=2019-07-09, status=1, ipAttribution=)]
    2019-07-09 ms3008351449862449

    不错,谢谢分享

    0

相关资讯

SPSS进行重复测量的多因素方差分析

1、概述 重复测量数据的方差分析是对同一因变量进行重复测量的一种试验设计技术。在给予一种或多种处理后,分别在不同的时间点上通过重复测量同一个受试对象获得的指标的观察值,或者是通过重复测量同一个个体的不同部位(或组织)获得的指标的观察值。重复测量数据在科学研究中十分常见。 分析前要对重复测量数据之间是否存在相关性进行球形检验。如果该检验结果为P﹥0.05,则说明重复测量数据之间不存在相关性,

方差分析后的两两比较方法太多了,该怎么选择?

两两比较方法的选择,大概是统计学界争议最多的一个话题了,直至今天,也没有一个完全统一的说法。所以,本文虽然说是两两比较方法的选择,但更多的是在基于以往文献的基础上,再结合作者本人的经验和理解,给读者一些提示。两两比较的方法太多了,正因为太多了,所以往往大家都不知道给怎么选择。比如SAS提供了12种两两比较方法让人选择,SPSS更是毫不吝啬地给出了18种方法让你选择。我想任何一个非统计专业的人都