审稿人发现要审核的稿件抄袭了自己的论文,疑似是用AI改写后再投稿
本文整理自Nature于2024年9月4日发布的一则新闻报道,原文题目为“Publishing nightmare: a researcher’s quest to keep his own work from being plagiarized”。
当生物信息学家Sam Payne准备审核一篇论文手稿时,未曾预料到这篇手稿与自己的论文会如此相像。
相关阅读:无巧不成书!一审稿人发现要审核的稿件盗用了自己论文的图片
2024年3月,Payne第一次看到这份手稿,研究内容为细胞样本量对蛋白质分析的影响。Payne表示这篇文章与他三年前发表的一篇论文[1]非常相似,有几张图甚至一模一样。他给期刊发了邮件,期刊很快就拒绝了这份手稿。
Payne文章原文:https://www.mcponline.org/article/S1535-9476(21)00058-X/fulltext
7月,Payne发现该手稿已发表在Wiley旗下期刊《Proteomics》上[2],他提醒了编辑。8月15日,《Proteomics》撤回了这篇论文。撤稿声明指出,该论文与Payne的论文“存在大量重复,且未注明来源”。Wiley的一位发言人表示:“这篇论文同时提交给了多家期刊,均包含了剽窃图片。”
撤稿声明还指出,有四位作者表示他们“没有参与文章的撰写和投稿,也没有同意发表”,第5位作者没有做出回应。然而后续调查发现几位作者与同一家论文工厂存在关联。
期刊《Accountability in Research》主编Lisa Rasmussen表示,Payne的论文被剽窃,凸显了全球学术界的系统性漏洞。一项分析显示,仅2022年就发表了约7万篇具有论文工厂特征的论文。
尽管问题严重,但期刊界并没有国际刑警组织,也没有官方机构对可疑稿件发出警报。Rasmussen说:“审稿人正是被剽窃的作者,这完全是运气好。很显然,我们不能应该依赖这种意外发现。”
多种剽窃形式
Payne表示,该手稿中的一些图表直接复制了他研究中的图表,而另一些图表使用了同样的数据,用这些数据重新绘图。
图. 重新绘制的图片
左:Payne等人2021年发表的论文;右:剽窃论文
剽窃论文的正文部分与Payne的论文相似,但不完全相同。例如,Payne的论文写道:
“From the large population of 10,000 cells, we subsampled a given number of cells n_sample ∈ [7, 16, 20, 30, 100] and calculated S/Vest.”
《Proteomics》论文的相应段落,使用了相同的数字,但是表述有轻微差异:
“The authors calculated S/Vest using samplen = [7, 16, 20, 30, 100] cells from a population of 10,000 cells.”
第三人称的使用,引起了Payne的注意,这一奇怪的现象让他认为自己的论文是被人工智能(AI)改写了。
剽窃论文可能来自论文工厂
剽窃论文的两位作者,Dmitrii Babaskin 和 Tatyana Degtyarevskaya,此前在同一家期刊上也有过撤稿的经历[3,4]。2022 年 7 月发布的两则撤稿声明指出了相同的问题:“研究可能与出售作者身份和文章的论文工厂有关。”
这两份声明引用了科学侦探Brian Perron等人的调查证据,他们发现两篇撤稿论文与论文工厂International Publisher有联系。Babaskin 和Degtyarevskaya均未做出回应。
International Publisher网站刊登了1万多篇手稿的广告,主题多种多样。潜在买家可以看到论文的标题(有时还包括摘要),以及预期发表期刊在引文数据库Scopus 中的排名。根据作者排名位置,费用从500-3000美元不等。该公司承诺,在线发表的标题和摘要将“完全改头换面,没人能发现。”
2021年,Perron等报告说,他们发现了近200篇可能来自International Publisher的论文。Perron说,许多已发表的论文与待售论文“几乎一字不差”。其中的许多论文后来被撤稿。
当论文出售后,International Publisher会从他们的在线目录中删除这些论文。为了查看这些被删除的论文,调查人员检查了Perron提供的包含这些论文历史记录的数据库,并与International Publisher网站的历史截图进行对照。结果显示,本文提到的剽窃论文,其中四位作者发表的多篇文章标题,与International Publisher之前挂牌出售的论文标题相吻合。
这些论文列表并不包括文章全文,但强有力的证据表明论文工厂的列表与很多已发表的研究有关。例如,2021年9月,论文工厂的网站截图显示,待售论文#1584题为“The structure of forest vegetation on industrial dumps of different ages”。2023 年 7 月,该论文被发现发表在《Ecology and Evolution》上,论文的标题和摘要几乎相同。
尽管调查人员没有在International Publisher网站上找到《Proteomics》剽窃论文的销售清单,但Perron表示,这篇论文具有几项“论文工厂”文章的特征:作者从未发表过任何与该论文主题(蛋白质分析)相关的其他研究;该稿件在《Proteomics》外审期间也同时提交给了其他期刊。一稿多投是“论文工厂”文章企图发表的经典策略。
Wiley的发言人没有具体说明《Proteomics》论文是否来自论文工厂,但他表示:“经调查证实,出版过程确实存在系统性操纵。”
检查剽窃的工具
近年来,一些出版商和期刊针对剽窃和论文工厂采取了额外的应对措施。STM诚信中心是一个面向科学出版商的检测平台,包括“论文工厂检查”和“一稿多投检查”等工具。其中,“一稿多投检查工具”被150多家期刊使用,每月检测2万多篇论文。
对于Payne来说,论文工厂使用AI来剽窃论文更令人生畏。“这是一个很好的骗局,类似情况估计会越来越多。”
本文整理自:https://www.nature.com/articles/d41586-024-02554-8
参考文献:
1. Mol Cell Proteomics. 2021:20:100085.
2. Proteomics. 2024 Jul;24(14):e2300351.
3. Tsvetkova, M., Ushatikova, I., Antonova, N., Salimova, S. & Degtyarevskaya, T. Int. J. Emerg. Technol. Learn. 16, 65–78 (2021).
4. Ecol Evol. 2023 Jul 7;13(7):e10276.
------分割线------
点击链接:临床研究全流程课程 - 科研专栏 - 医咖会 (mediecogroup.com),学习70多篇SPSS教程,30多篇R教程,以及更多科研教程!