那些年,收到的让人无法回答的审稿人意见

2020-03-16 小白学统计 小白学统计

写文章投稿,审稿人给出的建议是五花八门。林子大了,什么鸟都有。同样,审稿意见多了,什么内容都有。虽然我们尊重审稿人及其意见,然而,总有一些审稿意见让人真的无法回答,又难以反驳。本文聊一下我个人遇到的一

写文章投稿,审稿人给出的建议是五花八门。林子大了,什么鸟都有。同样,审稿意见多了,什么内容都有。虽然我们尊重审稿人及其意见,然而,总有一些审稿意见让人真的无法回答,又难以反驳。本文聊一下我个人遇到的一些让人真的难以回答的审稿意见,看看各位朋友有没有同感。
第一:logistic回归只能用发病和不发病的分析
这是10多年前的一位审稿人给的意见,当时我还在读研究生。帮别人分析了一篇文章,分析护士满意度的影响因素,利用问卷调查,结局分为满意和不满意。分析方法采用了logistic回归进行多因素分析。投稿后,被审稿人拒稿,拒稿意见是:logistic回归只能用于“发病”和“不发病”的分析,不能用于“满意”和“不满意”的分析。
看到这个审稿意见,第一反应是错愕、惊讶,然后才是无奈、无语。实在不明白审稿人怎么会有这种想法。当时作为一所三流医学院学生的我,第一次感到,原来我心目中觉得遥不可及的杂志,也并不是那么完美无瑕。
如果logistic回归只能用于“发病”和“不发病”的分析,那我实在想不出在经济学领域和社会学领域、心理学领域等为什么还要讲logistic回归?难道不怕被人质疑吗?
第二:你用spss做,不要用R做
这是去年的一个审稿意见,也不是我的文章。一个朋友的文章,他用R做了数据分析,我也看了这个文章,中规中矩,没什么特别创新,但也没什么大的漏洞。然而最后审稿意见中其中一条真的让我大跌眼镜,审稿人建议用spss做,不要用R做。
我真的怀疑,难道这位老师只能看懂spss给出的结果,看不懂R给出的结果?对于常规方法,你用什么软件,其实差别并不大,结果都是一致的。我这也是第一次遇到有人建议重新换个软件,重新给结果。然而你不敢说这句话,最后还得在回复里写:谢谢审稿老师的宝贵建议,我们已经改成了spss的结果。虽然其实并没改,因为结果完全一样。
我个人一直认为,用什么软件看自己习惯。虽然我个人习惯用SAS(毕竟用了十多年,都有感情了),然而我也会用SAS jmp、R、Stata,或者一些小众软件,如LISREL,MLwin等。没有人规定某种结果必须用某种软件,除了临床试验中,FDA会推荐某种软件。
第三:你不要用logistic回归,要换一种更高级的方法
一个朋友写一篇预测类文章,帮朋友建了一个预测模型,方法用了logistic回归,预测效果还不错,训练集、预测集的ROC基本都在90%以上。兴冲冲投稿,然后被审稿人一句话泼了一头凉水:你不要用logistic回归,换一种高级的统计方法。
心里很凉,不是因为文章没接受,而是因为这句话。我一直认为:统计学方法没有低级和高级之分。因为我一直想不通什么算是高级?线性回归比t检验高级吗?logistic回归比卡方检验高级吗?神经网络比logistic回归高级吗?劳动不分贵贱,方法竟然要分高低?
统计方法更多的是适用与否,不同数据、不同目的都需要考虑相应的不同方法。尽管近几年机器学习、深度学习这些充斥着我们的学术领域,感觉好像在讲座上不提点人工智能都不好意思发言,似乎传统的这些回归方法都已经羞的应该躲到地缝里去。然而我还是想说,方法始终是方法,软件始终也只是软件,所有的统计分析中,人才是第一位的。不要盲目相信方法、相信软件,更重要的是,要相信自己。
logistic回归是有自身的缺点,但所谓换种更高级的方法,我个人认为,不应该出自一个专业统计学家之口。也许,审稿人认为,像这些机器学习方法是高级方法,应该用这些,然而这些方法也并非尽善尽美。作为文章来说,结果和专业解释都没有问题,却让换种所谓“高级”的方法,确实有点匪夷所思。
第四:计数和等级资料的关系应该用秩和检验,不能用卡方检验
某文章中,我做了一个分析,分了三组:小剂量、中剂量、大剂量,比较三组的一些指标,如性别、是否远处转移等,基本都是一些分类资料。如下图所示:

然后一位统计学家就不同意了:你这个数据,一个是等级资料(估计说的是分组变量),一个是计数资料(估计是指性别、年龄等分类资料),不能用卡方,这种数据应该用秩和检验。
我看了意见,不由得长叹一口气。都已经2020年了,竟然还有统计学家提这种意见(事实上,审稿人是不是统计学家我还真不确定)。我翻遍了所有的统计学课本,也没有人规定说:一个等级资料、一个计数资料(实际上是分类资料),要用秩和检验。
即便是一个等级资料、一个(无序)分类资料,也需要根据实际情况来考虑所用的方法。如果(无序)分类资料是分组变量,等级资料是结局变量,一般使用秩和检验;但如果等级资料是分组变量,(无序)分类资料是结局变量,那用秩和检验就严重错误了。实在搞不清审稿人为什么要逼良为娼,逼对改错。
第五:你的回归分析的表格要转置过来
某文章中,我帮一个朋友做了一个回归分析,大致样式如下(只显示了其中的3个变量,而且把具体的变量名改成了x1-x3):

然后就是这个表格,审稿人提出了意见:这种表格有必要列吗?如果列的话,注意主谓倒置过来。
我看完这个意见,只觉得胸口一阵发闷,差点眼前一黑。我不知道审稿人到底有没有见过回归分析的结果,如果要转置过来,那就是下面这种样式:

说实话,这种样子的回归分析结果我还真的没在文章里见过。到底什么是主谓?我倒是想根据审稿人意见修改,然而真的下不了手。最后只能各种委婉解释,说明我们才疏学浅,能不能放我们一马。
我想实际中这种情况可能并不在少数,一旦遇到这种情况,我也会很郁闷,尤其是朋友把这些审稿意见给我,让我帮忙看看怎么回复。说实话,其实真的不知道怎么回复。

版权声明:
本网站所有注明“来源:梅斯医学”或“来源:MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:梅斯医学”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. 2020-09-01 14818eb4m67暂无昵称

    学习

    0

相关资讯

临床研究统计学中常见的“坑”

随机对照临床试验(Randomized Controled Trial, RCT)是常见的重要的循证医学证据,为临床诊治提供重要依据。在临床试验设计中,专业设计和统计学设计都很重要。统计学设计包括:确

如何通俗地理解Family-wise error rate(FWER)和False discovery rate(FDR)

Family-wise error rate(FWER),暂时还不了解比较通俗易懂的翻译。False discovery rate(FDR),一般翻译为错误发现率。在研究使用假设检验解决机器学习中的分类问题时,我遇到了多重假设检验问题。FWER和FDR正是解决这一问题的两种方法。经过老师和师兄师姐的指导,我能够将FDR应用于自己的问题当中,并且实验结果也有所改善。但是,应用之后,我仍然存在一些

2020年癌症统计:美国癌症死亡率创纪录下降

2020年1月8日,最新的美国癌症发病情况年度报告《2020年癌症统计》公布,这是由美国肿瘤学会每年在《CA:临床医生癌症杂志》上发布的报告。这份报告显示,1991年至2017年,美国癌症死亡率下降29%,其中2016年到2017年下降2.2%,创有记录以来美国癌症死亡率的最大年度降幅。报告指出这一进步主要归结于4种常见癌症的死亡率长期下降:肺癌、结直肠癌、乳腺癌和前列腺癌。图 | 参考资料1

CA Cancer J Clin:2019年年龄不小于85岁成年人癌症统计研究

在美国,年龄不小于85岁的老年人口在快速的增长,而他们的癌症状况仍旧所知甚少。最近,有研究人员综合不同的数据库全面的提供了年龄不小于85岁老年人的癌症发生情况。研究发现,在2019年,美国将会大约诊断140690个癌症案例,且将有103250例癌症死亡。在这些个体中最常见的癌症为肺、乳腺、前列腺和结肠直肠癌,这与普通人群相同。总的癌症发生率在男性和女性中的峰值在1990年,之后发生率加速减少。这些

统计报告指南:厘清统计学诸多误区与错误

2019年3月,European Urology 杂志(IF=17.298)发表了泌尿外科临床研究领域的统计报告指南《Guidelines for Reporting of Statistics for Clinical Research in Urology》,目的在于提升人们的统计学知识,改善论文质量。 本指南由11个大学的生物统计中心、共16名研究人员共同完成,同步

对医疗保健行业产生巨大影响的10个医疗物联网统计

在过去的几年里,物联网对医疗保健行业产生了巨大影响。以下这些统计数字就是强有力的证明。1、2018年,全球医疗物联网市场规模为1471亿美元去年,全球医疗物联网市场规模超过1470亿美元。与2014年的217亿美元相比,这是一个巨大的增长,物联网分析显示,最大的增长尚未开始。2、到2025年,医疗领域物联网的全球市场规模预计将超过5000亿美元专家预测,到2025年,该行业的全球市场规模将达到53

打开APP