「复制粘贴论文」事件很快有了处理结果,下一个问题是:NeurIPS 的未发表论文是怎么泄露出来的?
把一篇 NeurIPS 2020 的论文投稿换个作者名字发到 arXiv 上,这样直接的造假行为着实让人摸不着头脑。前段时间,一篇标题为《 Label Assignment Distillation for Object Detection 》的论文被举报抄袭。其中,论文作者之一张某某是北京理工大学一名 2020 级硕士研究生。涉嫌抄袭的论文,原链接:https://arxiv.org/pdf/2109.07843.pdf这一事件立即引来了人们的广泛关注。9 月 30 日,北京理工大学研究生院网站发布了《关于对我校研究生张某某处分的情况通报》,表示校方已认定张某某「滥用学术成果署名」,属于「严重学术不端」,并决定给予张某某留校察看处分。以下是北京理工大学发布的通报原文:此前,这篇 9 月 17 日上传到 arXiv 上的论文被旷视研究员王剑锋在知乎发文举报抄袭,他是被抄袭论文的作者之一。被抄袭论文为王剑锋等人在国际深度学习顶级会议 NeurIPS 2020 的投稿。王剑锋在知乎文章中称:「我们的投稿,被泄露并被抄袭挪用了。」可以看到,两篇论文的标题一模一样。不仅如此,从两篇论文的对比中,我们可以发现两篇文章摘要几乎完全一致、图片完全一致、表格数据完全一致。王剑锋表示:「(抄袭论文的)作者们主要修改了部分措辞,并采用了 CVPR 2021 的 latex 模板,这一过程完全是主观刻意的。我们要强调一点,arxiv 文章中没有任何一个配图、表格、公式是新的,完全没有做额外的实验。」但王剑锋与论文作者取得联系之后,对方并没有承认论文剽窃。9 月 20 日,北京理工大学发布公告表示已启动调查。如今,北京理工大学的通报再度证实了这篇 arXiv 论文的抄袭事实。至于没有公开发表的论文是如何被原样复制出来的,目前我们还无法得知。NeurIPS 一直采用双盲评审方法,理论上能够获得论文 PDF 的人仅限于论文合作者与审稿人。根据 NeurIPS 2020 当时的规定,部分论文作者也被列入了审稿人的行列,人们猜测或许是有某个学生在帮老师审稿时获得了该论文稿件,进而引发了后来的抄袭事件。去年的 NeurIPS 创造了历史最高记录的 9467 篇论文投稿,在空前的压力之下,会方采取了「提前拒稿」方式(今年已被取消),并引入了大量新审稿人,造成了一定争议。不过让人没有想到的事,这也为有人买论文创造了「机会」。最近发生的事件再次引发了人们对于花钱买论文行为的思考。迄今为止,国家卫生健康委员会(NHC)和国家自然科学基金委员会(NSFC)已经在 3 月到 9 月间的 42 次调查中制裁了至少 23 名寻求第三方论文代写,或数据造假的违规行为。研究人员找论文代写或购买数据,往往是因为有足够的论文数才能获得学位或职称。过去一年里,打击学术造假的行动有了更多进展,各类科学期刊撤回了上百篇疑似来自论文工厂的文章。今年 3 月,国际顶级科学期刊 Nature 报道称,自 2020 年 1 月以来已有 370 篇此类文章被撤回,作者全部来自中国的医院。根据 Nature 统计,这个数字现在至少已经飙升到了 665。对此,自 2018 年起科技部宣布了以打击学术不端行为为目的的全面改革。去年推出的政策还首次明确提及了论文工厂问题。根据政策,严重违规的行为必须公之于众。今年 3 月和 7 月,国家自然科学基金委员会通报了 13 起学术造假行为。其中 6 项涉及论文工厂。违规者获得了通报批评、取消基金项目申请资格多至 7 年、六年内不得晋升等处罚。https://grd.bit.edu.cn/xwgz/xwtzgg/3944e225b5824d31a7297657760d1b3d.htmhttps://www.nature.com/articles/d41586-021-02587-3