他让数百篇论文被撤稿或被更正...

2019-08-08 医咖会 医咖会

Carlisle是一名麻醉科医生,在业余时间,他就像一个侦探,翻找临床研究中那些可疑的数据。在过去十年里,他调查了很多领域的研究,从饮食相关研究到治疗指南。他在数百篇论文中发现了学术不端和其它错误,导致论文被撤稿或者被更正,甚至终结了某些造假大户的职业生涯。(注:全球被撤稿最多的人员名单见下图)Retraction Watch盘点的撤稿最多的人员名单https://retractionwatc

Carlisle是一名麻醉科医生,在业余时间,他就像一个侦探,翻找临床研究中那些可疑的数据。在过去十年里,他调查了很多领域的研究,从饮食相关研究到治疗指南。他在数百篇论文中发现了学术不端和其它错误,导致论文被撤稿或者被更正,甚至终结了某些造假大户的职业生涯。(注:全球被撤稿最多的人员名单见下图)


Retraction Watch盘点的撤稿最多的人员名单

https://retractionwatch.com/the-retraction-watch-leaderboard/

麻醉领域,“造假”的重灾区?

十多年前,Carlisle和其他麻醉学家聊起日本研究人员Yoshitaka Fujii发表的那些研究。Fujii当时发表了一系列RCT,调查了各种药物对预防患者术后呕吐和恶心的影响。数据看起来太过理想,以至于很不真实。Carlisle决定利用统计学方法来检查这些数据。

2012年,他指出,论文中描述的结果能真正出现的可能性极小[1]。部分由于他的分析,杂志编辑要求Fujii当时和以前的大学展开调查,2012年,Fujii被大学开除,最终183篇论文被撤稿,创下了历史记录。

4年后,Carlisle与人合作发表了对另一位日本麻醉学家Yuhji Saitoh研究的分析,发现他的数据也非常可疑[2],Saitoh目前有53篇文章被撤稿。

还有其他研究人员参考了Carlisle的做法。例如,2016年,新西兰和英国的研究人员在骨科研究者Yoshihiro Sato的论文中发现了一些问题[3],导致了27篇论文被撤稿。Sato最终有66篇论文被撤稿。

在上述事件之前,麻醉科就曾因数起学术欺诈丑闻而受到冲击,其中包括德国麻醉医师Joachim Boldt的事件,他已被撤稿了90多篇论文。Carlisle甚至开始怀疑是不是只在麻醉科有学术欺诈。因此,他挑选了8本主要医学期刊,利用业余时间查阅了数千项随机试验。

2017年,Carlisle在《Anaesthesia》杂志上发表了一篇分析文章,称在16年来发表的5000多项试验中,发现90项研究的数据很可疑[4]。目前为止,这些论文至少有10篇已被撤稿,6篇被改正,包括发表在《NEJM》上的一项关于地中海饮食对健康益处的研究,不过,这篇文章没有任何学术欺诈的行为,是作者在对参与者的随机分组上犯了一个错误。在作者删除了错误数据后,这篇论文重新发表,结论与之前类似[5]。

Carlisle一直在坚持审查论文中的可疑数据,今年,他对意大利外科医生Mario Schietroma进行的数十项麻醉研究提出了警告,称这些研究并不是临床实践的可靠依据[6]。Myles是该Carlisle报告的合着者之一,去年,Myles在Schietroma的五篇论文中发现对照组和患者组的原始数据存在可疑的相似之处。

Schietroma的研究结果对全球各地的医院都产生了影响, WHO在2016年引用了Schietroma的研究成果,发布了一项建议,即麻醉医生在手术期间和术后应常规提高给患者的氧气水平以减少感染。Myles说,这是一个有争议的建议,在某些手术中,过多的氧气可能会增加并发症的风险,而这些建议可能意味着,较贫穷国家的医院会把更多预算花在氧气上。

Myles警告过的五篇论文很快被撤稿,WHO将其建议从“强推荐”修改为“有条件推荐”,这意味着临床医生有更多的自主权为不同的病人做出不同的选择。

Schietroma说,他的统计是由一名独立统计学家来进行的,且通过了同行评审,两组患者他特意选择了类似的患者群体,所以两组的数据非常接近,也就不足为奇了。他还表示,2009年发生地震时,丢失了与试验有关的原始数据和文件。该校一位发言人表示,已经交给“相关调查机构”处理,但没有解释是哪些机构,也没有说明调查是否正在进行中。

仅仅是错误,还是造假?

Carlisle的数据审查方法并不新颖,他表示:真实的数据有其自然规律,而人造数据很难重现。1938年美国科学家Frank Benford推广了这种数据审查方法,并被许多统计人员使用。

(该方法详见下方链接,本文不再详述:

chrome-extension://oemmndcbldboiebfnladdacbdfmadadm/http://datacolada.org/wp-content/uploads/2018/08/4409-Benford-1938-Law-of-anomalous-numbers.pdf)

以随机对照试验为例,Carlisle观察基线数据,这些数据描述了试验中参与者的入组特征,通常是对照组和干预组,包括身高、体重和相关的生理特征,通常在论文的第一个表格中描述。在RCT中,参与者被随机分配到对照组或(一个或多个)干预组。因此,各组中每个特征的均值和标准差应该大致相似,但不可能完全相同。

2017年,Carlisle在《Anaesthesia》杂志上发表的那篇对5000项临床试验的分析[1],引起了《Anesthesiology》杂志编辑们的强烈反响,该杂志上发表过12篇被Carlisle列为有问题的论文。在对《Anaesthesia》的一篇回复信中,统计专家Timothy Houle强调了一些问题,比如Carlisle使用的方法可能会出现假阳性,使用检测伪造数据的有效工具(类似于剽窃检查软件)可能会更好,但Carlisle的方法并非如此。”[7]

今年5月,《Anesthesiology》确实改正了Carlisle强调的其中一篇论文,指出两个表格中P值有“错误”,但作者丢失了原始数据,无法重新计算这些值,然而,作者在评论中仍坚持自己的观点。

在过去的几年里,Carlisle使用的方法并不是唯一一种用于检查已发表论文数据的方法。

Michèle Nuijte开发了一种她称之为“spellcheck for statistics”的程序,可以扫描期刊文章,检查统计数据是否内部一致。使用“Statcheck”可以检验结果中报告的数据是否与计算的P值一致。

(详见:

https://www.nature.com/news/stat-checking-software-stirs-up-psychology-1.21049)

荷兰心理学研究生Nick Brown和波士顿研究人员James Heathers,使用一个叫做GRIM的程序复核统计方法的正确率,作为标记可疑数据的另一种方法。

(详见:

https://medium.com/@jamesheathers/the-grim-test-a-method-for-evaluating-published-research-9a4e5f05e870)

斯坦福大学的John Ioannidis说:”人们对这类审查越来越感兴趣,它们是很棒的工具”。但他警告称,不要对问题的原因妄下结论。他表示:“学术欺诈和只是有错误,是完全不同的。”

Brown, Nuijten和Carlisle也都同意,他们的审查工具只是凸显了需要调查的问题。Nuijten表示“不想把statcheck程序和学术欺诈联系在一起”。Ioannidis认为,这类工具的真正价值在于,在论文发表前对有问题的数据进行筛查,从而在一开始就防止学术欺诈或有其它错误。

Carlisle说,越来越多的杂志编辑联系他,希望能用他的方法来审查论文。但大部分时候都是在非正式的情况下临时完成的,仅仅是在编辑已有所怀疑的情况下才会这样做。但至少已经有两家期刊往前走了一步,将统计检查作为所有论文发表过程的一部分。

但即使发现一项研究存在学术欺诈,也不一定能彻底解决问题。2012年,韩国的研究人员向《Anesthesia & Analgesia》杂志提交了一项试验,研究内容为面部肌肉张力如何提示插管的最佳时间。编辑非正式地让Carlisle审查了这篇文章,他发现患者数据和总结数据存在差异,论文被拒稿了。

然而,这篇论文随后投到了Carlisle自己的期刊上,但更换了患者数据,Carlisle认出了这篇论文,它再次遭到了拒稿,两家杂志的编辑都联系了作者及其所在机构,表达了他们的担忧。令Carlisle吃惊的是,几个月后,这篇论文,与上一版没有任何变化,发表在《European Journal of Anaesthesiology》杂志上。在Carlisle与该期刊编辑说明了对这篇文章的质疑之后,该论文于2017年被撤稿,原因是“他们的数据存在违规行为,包括对结果的错误陈述”。[8]

参考文献:

1. Anaesthesia. 2012 May;67(5):521-37.

2. Anaesthesia. 2017 Jan;72(1):17-27.

3. Neurology. 2016 Dec 6;87(23):2391-2402.

4. Anaesthesia. 2017 Aug;72(8):944-952.

5. N Engl J Med. 2018 Jun 21;378(25):e34.

6. Anaesthesia. 2019 May;74(5):573-584.

7. Anaesthesia. 2018 Jan;73(1):125-126.

8. Eur J Anaesthesiol. 2017 Apr;34(4):249.

文章整理自:

How a data detective exposed suspicious medical trials. Nature. 23 July, 2019.

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=370953, encodeId=ab353e0953b6, content=好, beContent=null, objectType=article, channel=null, level=null, likeNumber=71, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=afa32365525, createdName=122e052cm96暂无昵称, createdTime=Thu Aug 08 19:19:33 CST 2019, time=2019-08-08, status=1, ipAttribution=)]
    2019-08-08 122e052cm96暂无昵称

    0

相关资讯

王增武:中国高血压防控现状的喜和忧

早在1958年“大跃进”时期,我国就开始了高血压防治工作,并将其作为控制慢性病的抓手与切入点。“让高血压低头,让肿瘤让路”的宏伟口号也是那时提出的。如今,中国高血压防治工作已走过了60多个年头,高血压真的“低头”了吗?2018年,中国医学科学院阜外医院、北京高血压防治协会会长王增武教授团队在Circulation发布的中国“十二五”高血压抽样调查最新结果显示,我国18岁及以上居民高血压患病粗率

不可置之不理 否则输卵管有爆裂危险 夺人性命

宫外孕案例:作为妇科急诊死亡率最高的疾病,“宫外孕”一年比一年多,它就像一枚不定时炸弹,随时爆裂,一旦诊治不及时可能就会有生命危险,每位医生都很小心堤防,之前我们就遇上了一例非常典型的宫外孕。客户停经9周,没有腹痛、没有出血,特地来体验我们新世纪妇儿医院的1元早孕检查套餐,看看肚子里这个小家伙的情况,但检查结果却让所有人都紧张起来。超声报告:发现附件包块,难道是宫外孕?血hCG检查:5323 IU

病历修改30余处 医院赔偿22万

案情简介患者王某,男,80岁,因发烧三天加重到中医院处住院治疗,中医诊断:发热、外感发热、风寒型;西医诊断:急性肺炎、脑梗塞后遗症、糖尿病、高血压病。入院第3日下午4时20分,患者病情骤变,呼吸、心跳骤停,抢救无效,于当晚10时许死亡。患者家属认为中医院在对患者在抢救过程中措施不力,向卫生局投诉,卫生局复印了患者的病案(以下称《卫生局病案》)。一月后患者家属复印了病案(以下称《医院病案》),经对比

《柳叶刀》对87,032名女性护士的研究证明 这类肉增加女性慢阻肺风险!

近日,柳叶刀发表的一篇文章表明:加工肉制品摄入增加与肺功能下降具有明显的相关性,不仅如此,加工肉类摄入过多还会增加女性COPD患病风险。慢性阻塞性肺病(COPD)是一种常见的疾病呼吸系统疾病,2018年4月10日,由北京中日友好医院王辰院士团队完成的大规模人群研究“中国成人肺部健康研究”首项成果发表于国际权威杂志《柳叶刀》上,研究结果显示,我国慢阻肺患者已经超约1亿人,成为几乎与高血压、糖尿病“并

风雨十年 医师多点执业困境如何破解

2009年,《中共中央国务院关于深化医药卫生体制改革的意见》提出:“稳步推动医务人员的合理流动,促进不同医疗机构之间人才的纵向和横向交流,研究探索注册医师多点执业。”随后,原国家卫生部印发《关于医师多点执业有关问题的通知》,并在部分地区先行试点。以新医改为标志,中国医师多点执业蹒跚起步。2009年,广东省和云南省昆明市率先行动推动政策落地,之后全国各地陆续实施医师多点执业。2017年,我国《医

医学统计中流传的“似乎正确”的错误,你听说过几个?

这个题目听起来似乎有点别扭,什么意思呢?就是说,有些话在医学统计中流传了很多年,不少医学生甚至有的流行病学、卫生统计学的老师或学生也这么说,但实际上,却偏偏是错误的说法。本文主要列举几个:1、分类资料又称计数资料在比较早的版本中,这种说法存在。现在的很多医学论文中,依然都这么说。然而分类资料与计数资料并不是一回事。其实他们的区别很容易,分类资料(categorical data)是类似于像性别