医学统计中流传的“似乎正确”的错误,你听说过几个?

2019-08-08 小白学统计 小白学统计

这个题目听起来似乎有点别扭,什么意思呢?就是说,有些话在医学统计中流传了很多年,不少医学生甚至有的流行病学、卫生统计学的老师或学生也这么说,但实际上,却偏偏是错误的说法。本文主要列举几个:1、分类资料又称计数资料在比较早的版本中,这种说法存在。现在的很多医学论文中,依然都这么说。然而分类资料与计数资料并不是一回事。其实他们的区别很容易,分类资料(categorical data)是类似于像性别

这个题目听起来似乎有点别扭,什么意思呢?就是说,有些话在医学统计中流传了很多年,不少医学生甚至有的流行病学、卫生统计学的老师或学生也这么说,但实际上,却偏偏是错误的说法。本文主要列举几个:

1、分类资料又称计数资料

在比较早的版本中,这种说法存在。现在的很多医学论文中,依然都这么说。然而分类资料与计数资料并不是一回事。

其实他们的区别很容易,分类资料(categorical data)是类似于像性别、职业、血型等名义型,它们的值都是无实际意义的,只是个标识而已。例如性别的男和女分别用1和2标识,这里你绝不能说2大于1。也就是说,在分类资料中,数值无所谓大小,只是个标志,你可以用1和2标识,也可以用5和98标识,只不过实际分析中没必要搞得那么复杂,所以都尽量简单地用1和2标识。

什么是计数资料(count data),顾名思义是可以清点计数的。比较典型的如咳嗽次数、疼痛次数、转移部位的个数等等。它们的值是有实际意义的,比如疼痛次数可能是1、2、3等,这里就可以说2大于1,4大于3等,因为3次就是大于2次,没什么可说的。这里的数值大小是起作用的。

如果从统计学角度来说,分类资料通常服从二项分布或多项分布,而计数资料通常服从Poisson分布或负二项分布。

现在还有不少文章在统计学方法中都提到“计数资料的比较采用卡方检验”,个人认为,严谨来说,应该是“分类资料的比较采用卡方检验”。

目前国内教材尚未严格区分这两个概念。我也查了很多文献和资料,很少有人清楚地阐述过这个问题,国内没有,国外也很少,但有的国外论坛中能看出大家对这两种资料的态度,肯定不是一回事,分析方法也不一样。维基百科(英文)对categorical data和count data是分别定义的,不是一回事。大家感兴趣的可以搜一下看看。

2、分类资料和等级资料的关系研究分析应该用秩和检验

这句话欺骗了很多人,让人觉得,凡是二维列联表中有一个是等级资料的,一定要用秩和检验。然而真相如何呢?我们举例说明一下:


这两个例子中,都是一个二分类资料,一个等级资料,那他们都要用秩和检验吗?非也。

关键的问题在哪儿呢?一定要区分:分组变量和分析变量。分析变量也就是结局可以看做因变量;分组变量也就是组别,可以看做自变量。

只有分析变量是等级资料的时候,才用秩和检验。分组变量是不是等级,无关紧要,不影响方法选择。记住:只看分析变量就行了。

例1中,分析变量(结局)是疗效,作为等级资料,所以比较的时候需要采用秩和检验。例2中,分析变量(结局)是二分类资料,不是等级资料,所以不用秩和检验,用卡方检验即可。至于例2中的年龄是等级资料,并不影响卡方检验的使用。当然,分组变量是等级资料,你可以进一步做趋势检验。

3、样本量大于30数据就服从正态分布了

再说这个问题之前,我们先看一下下面这个图形,这是1650人的数据分布,大家看一下像是正态分布吗?



很明显,这怎么也称不上正态。所以问题是很明确的,关键是为什么大家会这么认为?

其实主要原因是:所谓的“30例以上服从正态分布”这种说法,是指从任意的一个分布中进行抽样,如果每一次抽样样本的例数都大于30,那么,每个样本的统计量(如均数)其分布接近正态。这也就是“中心极限定理”说的意思,但它不是说,一次抽样样本的数据大于30,这份数据就服从正态分布。千万不要搞混了,中心极限定理不是说原始数据的,而是说的抽样分布。具体解释可参见前文。

4、凡是率的比较都可以用卡方检验

这又是一个被误解的典型错误说法,关键在于对“率”的定义。普通意义上的率,是指像二分类(如阳性和阴性、发病和不发病、有效和无效等)中的阳性率、发病率、有效率等。这类资料用卡方检验比较无可厚非。

然而还有一种率不能用卡方检验比较。比如变化率,假定有试验组和对照组,每组的观察对象都在第一个周测量了血糖值,第二周又测了一次,计算第二周相对第一周的变化率,这种率的计算方式通常是“(第二周-第一周)/第一周”,得到的也是“率”,然而这种率确是一个实实在在的连续资料,具有连续资料的一切特征,这时候如果你要比较两组的变化率有无差异,那就要按连续资料的方法,如t检验、秩和检验等。

有的人可能会有点糊涂,其实很好区分。典型的发病率、感染率等的“率”,是基于一群人只能计算出一个率,比如100人中感染40人,那100人的感染率就是40%。而作为连续资料的率,每个人都有一个率的值,比如,第一个人有一个变化率(如2.3%),第二个人也有一个变化率(如-0.6%)。

以前我曾见过这样的文章,明明是变化率,但却写的是用卡方检验,我一直很好奇,这么多的率,你是怎么放到软件里的?不觉得软件里没法放这些变量吗?

5、秩和检验效率远不如t检验(或方差分析等)

有的人把秩和检验看做“兵者,不祥之器”,不到万不得已不用。这也是不少人的一种偏见。我见过不少医学工作者,一看到数据不服从正态分布,立刻感觉整个天空都阴暗了。

我有时会说,可以用秩和检验,然而他们的回答是,不是说秩和检验不好吗?说实话,我一直不知道这些流言到底从何而来,源头到底在哪儿?似乎它就一直就存在了。是因为教材编排的原因吗?把它排在后面以至于不少人想当然就认为它是参数检验的备胎?还是其它原因?

秩和检验的效率并不是像很多人想象的那样低。事实上,从很久以前到现在的统计学家都做过不少模拟验证,即使数据符合正态分布,秩和检验的效果也不比t检验、方差分析等这些参数检验查,模拟的结果提示,这种情况下,秩和检验的效率大约是参数检验的95%。而一旦数据偏离正态分布,秩和检验的效率将远远优于参数检验。

暂时先想到了这几个问题,如果后面还有想到的,再另文撰写。希望本文能都对各位朋友有一定的启发和帮助。

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (2)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=1632049, encodeId=bfa6163204966, content=<a href='/topic/show?id=be9f3422e0e' target=_blank style='color:#2F92EE;'>#医学统计#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=35, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=34227, encryptionId=be9f3422e0e, topicName=医学统计)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=b87121842187, createdName=30397611, createdTime=Sat Dec 07 14:07:00 CST 2019, time=2019-12-07, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=374233, encodeId=54563e4233f7, content=写得好, beContent=null, objectType=article, channel=null, level=null, likeNumber=66, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=http://cdnapi.center.medsci.cn/medsci/head/2019/10/21/e031c1d6c6115cbe1737b2149e602c1d.jpg, createdBy=3c105212218, createdName=147612bem32暂无昵称, createdTime=Tue Oct 22 12:06:33 CST 2019, time=2019-10-22, status=1, ipAttribution=)]
  2. [GetPortalCommentsPageByObjectIdResponse(id=1632049, encodeId=bfa6163204966, content=<a href='/topic/show?id=be9f3422e0e' target=_blank style='color:#2F92EE;'>#医学统计#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=35, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=34227, encryptionId=be9f3422e0e, topicName=医学统计)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=b87121842187, createdName=30397611, createdTime=Sat Dec 07 14:07:00 CST 2019, time=2019-12-07, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=374233, encodeId=54563e4233f7, content=写得好, beContent=null, objectType=article, channel=null, level=null, likeNumber=66, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=http://cdnapi.center.medsci.cn/medsci/head/2019/10/21/e031c1d6c6115cbe1737b2149e602c1d.jpg, createdBy=3c105212218, createdName=147612bem32暂无昵称, createdTime=Tue Oct 22 12:06:33 CST 2019, time=2019-10-22, status=1, ipAttribution=)]
    2019-10-22 147612bem32暂无昵称

    写得好

    0

相关资讯

王增武:中国高血压防控现状的喜和忧

早在1958年“大跃进”时期,我国就开始了高血压防治工作,并将其作为控制慢性病的抓手与切入点。“让高血压低头,让肿瘤让路”的宏伟口号也是那时提出的。如今,中国高血压防治工作已走过了60多个年头,高血压真的“低头”了吗?2018年,中国医学科学院阜外医院、北京高血压防治协会会长王增武教授团队在Circulation发布的中国“十二五”高血压抽样调查最新结果显示,我国18岁及以上居民高血压患病粗率

不可置之不理 否则输卵管有爆裂危险 夺人性命

宫外孕案例:作为妇科急诊死亡率最高的疾病,“宫外孕”一年比一年多,它就像一枚不定时炸弹,随时爆裂,一旦诊治不及时可能就会有生命危险,每位医生都很小心堤防,之前我们就遇上了一例非常典型的宫外孕。客户停经9周,没有腹痛、没有出血,特地来体验我们新世纪妇儿医院的1元早孕检查套餐,看看肚子里这个小家伙的情况,但检查结果却让所有人都紧张起来。超声报告:发现附件包块,难道是宫外孕?血hCG检查:5323 IU

“胸路”不通走“腹路” 腹部提压心肺复苏带来急救新方法

心脏作为最为重要的器官,平时位于胸腔中部偏左下方,被由胸肋骨骨架构成的胸廓之“家”罩于其中,平素安然悠哉地节律跳动。当遇到心搏骤停(CA)时,使心脏恢复跳动的心肺复苏术(CPR)——传统方法胸外按压CPR成为首选。但当这个“家”遭遇各种原因引发创伤,即胸肋骨骨折,胸廓完整性遭到破坏,这种情况的CA却是胸外按压CPR的禁忌证。1.突破困境寻找第二个“家” 面对这种困境,医师该如何实施CPR呢?2

病历修改30余处 医院赔偿22万

案情简介患者王某,男,80岁,因发烧三天加重到中医院处住院治疗,中医诊断:发热、外感发热、风寒型;西医诊断:急性肺炎、脑梗塞后遗症、糖尿病、高血压病。入院第3日下午4时20分,患者病情骤变,呼吸、心跳骤停,抢救无效,于当晚10时许死亡。患者家属认为中医院在对患者在抢救过程中措施不力,向卫生局投诉,卫生局复印了患者的病案(以下称《卫生局病案》)。一月后患者家属复印了病案(以下称《医院病案》),经对比

《柳叶刀》对87,032名女性护士的研究证明 这类肉增加女性慢阻肺风险!

近日,柳叶刀发表的一篇文章表明:加工肉制品摄入增加与肺功能下降具有明显的相关性,不仅如此,加工肉类摄入过多还会增加女性COPD患病风险。慢性阻塞性肺病(COPD)是一种常见的疾病呼吸系统疾病,2018年4月10日,由北京中日友好医院王辰院士团队完成的大规模人群研究“中国成人肺部健康研究”首项成果发表于国际权威杂志《柳叶刀》上,研究结果显示,我国慢阻肺患者已经超约1亿人,成为几乎与高血压、糖尿病“并

风雨十年 医师多点执业困境如何破解

2009年,《中共中央国务院关于深化医药卫生体制改革的意见》提出:“稳步推动医务人员的合理流动,促进不同医疗机构之间人才的纵向和横向交流,研究探索注册医师多点执业。”随后,原国家卫生部印发《关于医师多点执业有关问题的通知》,并在部分地区先行试点。以新医改为标志,中国医师多点执业蹒跚起步。2009年,广东省和云南省昆明市率先行动推动政策落地,之后全国各地陆续实施医师多点执业。2017年,我国《医