JAMA建议将P值降至0.005 会心一击

2018-04-13 佚名 环球医学

4月10日,斯坦福大学的Ioannidis JPA在《JAMA》发表了题为《The Proposal to Lower P Value Thresholds to .005.》的文章,建议将P值的阈值降至0.005。写论文的各位亲们表示心碎一地。P值和伴随的统计学显着性检验方法正在为生物医学和其他学科带来挑战。绝大多数在摘要、全文或二者中报告P值的文章(96%)都包含≤0.05的值。然而,这些报告

4月10日,斯坦福大学的Ioannidis JPA在《JAMA》发表了题为《The Proposal to Lower P Value Thresholds to .005.》的文章,建议将P值的阈值降至0.005。写论文的各位亲们表示心碎一地。

P值和伴随的统计学显着性检验方法正在为生物医学和其他学科带来挑战。绝大多数在摘要、全文或二者中报告P值的文章(96%)都包含≤0.05的值。然而,这些报告强调的很多观点可能是假的。认识到统计显着性这一难题的重要性,美国统计协会(ASA)于2016年发表了一篇关于P值的声明。普遍认为现状存在问题,但究竟该如何解决这个问题更具争议性。ASA声明的撰稿人还撰写了20份独立的评论,着重讨论了不同方面并按优先次序排列了不同的解决方案。另一个由72名方法学家组成的大型联盟最近提出了一个具体的简单举措:将新研究的统计学显着性的常规P值值域从0.05降至0.005。该提案在一些圈子中得到了强有力的支持,并在其他领域受到关注。

假如上述提议成真,P值的阈值从0.05降至0.005,估计一半以上的研究都要废了……

大家对统计学意义(P值)很熟悉。结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,P值为结果可信程度的一个递减指标,P值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。P值是将观察结果认为有效即具有总体代表性的犯错概率。如P=0.05提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,0.05的P值通常被认为是可接受错误的边界水平。

关于P值的槽点也不少。通常,许多的科学领域中产生P值的结果≤0.05被认为是统计学意义的边界线,但是这显着性水平还包含了相当高的犯错可能性。结果0.05≥P>0.01被认为是具有统计学意义,而0.01≥p≥0.001被认为具有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判断常规。

上文所说,ASA发表了使用和解释P值的“六原则”:1、P值可以指示数据与一个给定模型的不相容程度。2、P值不能衡量某假设为真的概率,也不能衡量数据仅由随机因素造成的概率。3、科学结论、商业决策或政策制定,不应只取决于P值是否达到了一个给定标准。4、研究者需对研究进行完整的报告、保证透明度,才能做出合理的推论。5、P值或统计显着性并不能衡量效应的大小和结果的重要性。6、P值本身并不能衡量模型或假设的可信度。

P值误用问题应引发重视,特别是研究者把统计显着性作为科学价值的评价标准。这种误用是糟糕的决策和不能重复的研究的始作俑者之一,最终不仅会危害科学的进步,还会摧毁公众对科学的信任。

统计学研究方法并不只有一个P值。希望越来越多的研究能给科学本身带来益处。

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (0)
#插入话题

相关资讯

JAMA:生物医学文献中P值的演化

研究者对P值的使用和滥用产生了广泛的辩论。为了评估在过去25年生物医学文献的摘要和全文中大规模P值的报道,并探究除P值外其他统计信息出现的频率进行了一项研究。使用自动文本采集分析了文献中P值的报道,包括12 821 790篇MEDLINE摘要和1990-2015年PubMed中心(PMC)的843884篇摘要和全文。也评估了151个英文核心期刊和PubMed分类的特定的文章类型。随机抽取1000个

科学研究中数据分析的弊病-“P-值”

世界上顶尖的统计学家们发言称:目前的科学研究中需要停止使用P-值以及显著性差异作为检验他们实验结果是否重要的依据。也许你会觉得这个说法毫无道理。什么时候研究者们会用到P-检验呢?当发现实验结果的自变量与因变量之间存在一定的相关性,为了证明该相关性是合理的或仅仅是随机误差,他们会使用P-检验。P值越低,说明他们的结果可信度越高。如果P值小于0.05,就说明两组之间存在显著性差异(statistica

Nature:P值争议新一季:我们是否需要一个统一的P值阈值?

一部分科学家反对进一步提高统计显着性发现的认定标准。

美国统计协会吐槽P值滥用

P值的历史 P值得历史可以追溯到1770年,数学家拉普拉斯在处理50万左右的生育数据时,发现男性的生育率超过女性,对于这个无法解释的“超越”,他计算了一个叫做“P值”的东西,以确定这个“超越”是真实的。 很多统计学家误以为关于P值的正式文献是Fisher发表的,其实不然,最早在文献中正式阐述P值及其计算的,是统计学家Karl Pearson,你可能不了解他,但是他的Pearson卡方检验你

P值的统计学意义与临床意义的区别?

在医学科研领域,P值是特别神奇的数值,无数人为之欢喜或悲伤,甚至有无数种方法追求有统计学显著意义P值(P< 0.05)。但是我们真的应该只关注是否P< 0.05吗?P值有统计学意义等于有临床意义吗?

厉害了!百位作者借助Google Docs合作撰文讨论P值问题

有关“P<0.05表示有统计学差异”似乎从诞生之初就备受争议,事实上,为什么把检验水准定在0.05,有什么科学道理?到现在大家也没整明白,但是这并不妨碍众多作者在研究结果中对于P<0.05的痴迷,总得有点儿“有意义”的结果,论文才“好看”。但是呢,带来的问题是各种假阳性结果的泛滥。于是乎,就不断有人提出修改目前所使用的统计学显著的标准。