应该调低P值,还是干脆抛弃“统计显著性”?

2019-08-18 医咖会 医咖会

近年来,关于“statistical significance(统计显着性)”和P值的争议一直存在。前段时间,《Nature》发表了一篇题为《scientists rise up against statistical significance》的文章,《美国统计学家》也专门发布了一个针对P值的专刊。近日,《欧洲心脏病杂志》(EHJ)发表了一篇专家观点,再次针对“统计显着性”发表了自己的观点,

近年来,关于“statistical significance(统计显着性)”和P值的争议一直存在。前段时间,《Nature》发表了一篇题为《scientists rise up against statistical significance》的文章,《美国统计学家》也专门发布了一个针对P值的专刊。

近日,《欧洲心脏病杂志》(EHJ)发表了一篇专家观点,再次针对“统计显着性”发表了自己的观点,到底是降低P值,还是抛弃统计显着性,我们来看看这位专家持怎样的态度。

几十年来,论文中都基于p<0.05来声明具有“统计显着性”。然而,很多专家也发现,有些论文中的统计学意义和临床意义并不相符,p值的滥用问题很严重。2016年,美国统计协会(ASA)曾针对这些误用发表了共识(表1)。

表1. ASA关于P值的主要声明要点



方法学专家在核心问题上意见一致,但在许多关键细节上仍然存在分歧,更重要的是,在如何最好解决“统计显着性”问题上也存在分歧。理想情况下,所有学科都需要全面了解统计工具、注意事项和如何正确解读结果。然而,提高所有学者、临床医生甚至普通大众的统计素养需要长期的努力。

最常见和严重的误解是,“P< 0.05”就表示效果“是真的”,甚至结果“很重要”。目前大多数达到P<0.05的研究,并不太可能反映真实的因果效应,更不用说重要效应。大多数研究都存在偶发性或偏倚,可能很少真的具有临床重要意义且值得采取措施。

还有一个误解是,P≥0.05就必然意味着“不是真的”或“不存在差异”。小型研究可能就无法发现真正的差异性。如果偏倚削弱了估计值,即使是大型研究也可能会遗漏一些真正的差异。在某些领域,尤其是社会科学领域,有人认为不管差异多么小,也总是存在差异的。还有另一种学派主张,大多数经过检验的关联和效果很可能实际上是无效的。

前段时间,有学者针对文献都陷入“统计显着性等同于P< 0.05”这一困境,提出了两个解决办法。

其中一个建议是保留统计显着性,但要增加达到统计学显着性的难度 [PMID:30980045 ]。对于仍使用P< 0.05这个阈值的研究,该建议将统计显着性阈值改为P<0.005。这降低了“假阳性”,但增加了“假阴性”。如果“假阳性”确实相比“假阴性”是一个更严重且常见的问题,那么这种方法看起来合理。调低p值可能会给研究人员带来压力,迫使他们进行大规模(或许研究设计会更细致)的研究。

如果一个研究是评估不太可能发生的事件,P< 0.005可能仍然不足以保证真实性。此外,还有人担心,许多研究人员可能会更加偏激,强行使P值达到<0.005。尽管如此,这种使用P<0.005的方案还是比较简单,可以应用于已发表的和未来的研究,也可以迅速去除大量没有研究价值、没有临床意义的方向。

另一个解决办法是完全放弃“统计显着性”和任何“显着/非显着”的概念[PMID:30894741]。这种禁止“统计显着性”的概念但又保留P值的建议可能是不明智的,如果没有任何预先制定好的规则,任何研究人员都可能以对自己有利的方式来解释任何结果。

虽然“零假设”显着性检验常常被误用,但如果正确使用,按照预先制定的分析计划来处理研究问题,仍然是很有价值的,可以帮助排除掉“无意义”的结果。这在很大程度上取决于事先制定整个排除计划时考虑得有多仔细。对于许多临床研究,例如随机试验,是需要有预先定好的规则的。

EHJ文章中报告P值的情况

本文作者检索了欧洲心脏病杂志(EHJ)2018年发表的所有文章,检索出摘要中使用了“significant”这个词的文章。最终有62篇文章被纳入。只有11篇论文使用该词来指代临床意义,3篇论文明确写的是统计显着性(statistical significance),49篇论文是通过一个假设的统计推断间接提到了“significant/significance”。

62篇论文的摘要中,37篇至少报告了一个p值,62篇总共报告了141个p值,其中86%的p值<0.05。96%的摘要中至少有一个p值<0.05。

在P< 0.05的论文中,36%会写结果具有“提示性(suggestive)”,除非P< 0.005,否则不会提到统计显着性(statistical significance)。

许多P值是用截断值(cut-offs)来报告的,而不是精确值,如141篇论文中有13篇为P< 0.01, 30篇为P< 0.001, 7篇为P< 0.0001。目前多数人认为,用截断值表示p值不是最佳办法,应该给出准确的数字。例如,当P<0.01时,目前尚不清楚这意味着P=0.009还是p=0.0000000001。

总之,对统计显着性的阈值要求更加严格,会使大多数临床研究论文受益。更有争议的在于是否应该完全禁止统计显着性。不管怎样,更加考虑研究的临床意义,研究开展之前做好计划,使用合适的统计方法,可以帮助改善临床研究。

参考文献:Eur Heart J. 2019 Aug 14;40(31):2553-2554.

doi: 10.1093/eurheartj/ehz555.

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=1241666, encodeId=3bc412416660a, content=棒, beContent=null, objectType=article, channel=null, level=null, likeNumber=51, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=/v1.0.0/img/user_icon.png, createdBy=76525575603, createdName=ms9000001839830359, createdTime=Sun Aug 28 17:45:24 CST 2022, time=2022-08-28, status=1, ipAttribution=)]
    2022-08-28 ms9000001839830359

    0

相关资讯

中国肥胖预防与控制蓝皮书: 倡导防控肥胖要全社会共同参与

肥胖已成为全球公共卫生危机,中国是全球受影响人数最多的国家,约46%的成年人和15%的儿童肥胖或超重。2015-2019年,中国营养学会和北美华人营养学会发起,联合肥胖研究及管理领域的学者专家,从多角度、多层面,全方位地针对肥胖的流行、危害、诊断、治疗、预防等领域进行最新文献的总结、归纳和讨论,汇集而成《中国肥胖预防与控制蓝皮书》。本研究报告参考了国内外相关的最新研究和指南,首次以蓝皮书的形式发表

中国心血管病研究:2017年超3000篇论文发表在国际期刊

心血管领域研究质量10年内有望赶上发达国家近日,Nature子刊发表了北京安贞医院马长生和刘静两位教授述评文章,称当前中国心血管研究虽有不足之处,但预计十年内,研究质量持续提高并将赶上发达国家。作者介绍,10年来,为了有效控制心血管病,中国在临床研究投入了大量资金。2018年,国家科学基金投入了2.59亿元人民币资助了594个心血管系统相关项目,是2004年投入的10倍。2016年国家重点研发计划

美国全科医生年收入140万!中美全科医生差异在哪?

大学毕业才可以报医学院校,即使年收入20万美金,依然每年缺口1万人......关于美国全科医生,他们有很多成熟经验可以供我们借鉴,但同样也面临执业的瓶颈。近年来,随着家庭医生签约制度的落地,全科医生这一岗位在基层医疗机构中成了标配。很多人说,全科医生是一舶来品,与我国水土不服,但我们真对发达国家的全科医生有深入了解吗?中美全科医生的差异在哪里?全科医生未来发展趋势如何?带着这些疑问,“医学界”

肿瘤防治 赢在整合 ——2019中国肿瘤学大会在重庆召开

“肿瘤防治,赢在整合”。8月16日,2019中国肿瘤学大会在重庆召开。这是国内肿瘤学界规模最大、规格最高、覆盖学科最广的学术盛会,也是该大会发起20年以来首次走进西部城市。36位院士,1909名国内外肿瘤学领域知名学者和专家,3万余名肿瘤学界精英齐聚山城,共同对肿瘤防治进行探讨和交流,对肿瘤前沿和热点进行权威解析,推广世界最新肿瘤防控研究成果,搭建国际国内交流合作平台。同期举行的科普大会,现场参加

《我是医生不是神》走红 MV发起人讲幕后事

“我是个医生不是神,只是个普通人”。伴随着这段歌词,身后会议室里的同事们也突然转向镜头,齐刷刷竖起了大拇指:“没错!”近日,一段由四川省泸州市人民医院的医生自编自导的说唱MV《我是医生不是神》在网上热传,视频中,身着白大褂的医生通过说唱的形式讲述了医生的日常,让不少网友感慨:“医生的工作真是不容易。”探访:用半个月时间倾听医生吐槽通过镜头的切换,观众可以目睹一名医生从大学课堂、图书馆到医院的过渡,

致敬医师节:儿科医生发起科普倡议 呵护健康中国“生力军”

儿童健康是老师和儿科医生共同的愿望。值中国医师节到来之际,国家儿童医学中心、复旦大学附属儿科医院的儿科医生在由上海学校卫生保健协会、上海市卫健委健康促进处、复旦大学健康传播研究所以及复旦大学附属儿科医院共同主办的“健康中国战略”上海儿科行动推进研讨会上发起《儿科医务青年科普倡议》,承担起国家儿童医学中心的职责和使命,主动践行“健康中国行动”,也积极倡导儿童成为“自己健康的第一责任人”的理念。新