06138fd49c3913f04990d4c53b381f45.gif

整理 | 苏宓

出品 | CSDN(ID:CSDNnews)

“一字不差”、“抄袭”、“与 10 多篇论文有重复”......这两天,随着国际计算机视觉与模式识别会议(CVPR 2022)的落幕,这些字眼也充斥着 CVPR 2022 的一篇学术论文,热度居高不下。

根据 CVPR 大会介绍,本次会议共收到了来自全球 23389 名作者的 8161 篇投稿。其中大会接收了共计 2064 篇论文,接收率为 25.3%。在这些论文中,有 342 份被选为 Oral 论文(需要口头报告形式呈现论文),1721 份被选为 Poster 论文(海报形式展现论文)。

万万没想到的是,此次涉及抄袭、剽窃的论文正是入选 Oral 论文之一,而对象则是来自韩国首尔大学和韩国科学技术研究院的团队。

69b718b2641e68088955785d30eff1ea.png

前一天公开演示,后一天被“拆台”

据韩国日报报道,2021 年 11 月,韩国首尔大学研究团队向 CVPR 提交了一篇名为《E2V-SDE: From Asynchronous Events to Fast and Continuous Video Reconstruction via Neural Stochastic Differential Equations》的学术论文,该论文介绍了如何利用 AI 技术更快、更准确地将不规则和不连续的信息重建为视频图像。

e1775215cb80ca949de45019ab028552.png

这篇论文在简介中写道,“通过在模拟和真实场景数据集上进行大量实验,我们验证了我们的模型在各种视频重建设置下的表现优于最先进的方法。在图像质量方面,LPIPS 评分提高了 12%,重建速度比 ET-Net 高出 87%。”

最终,CVPR 将该论文评选为优秀论文,并在 6 月 23 日进行了正式的发表。

421f1f9d9f7600a782899cb5bcc63d84.png

然而,谁都没想到,“打脸”来得如此迅速。6 月 24 日,在知名视频平台 YouTube 上惊现一条时长为 7 分钟 17 秒的视频。

在视频的开头,举报者很直白地写道:

这个视频献给所有我们在撰写 E2V-SDE 论文时剽窃的论文作者,该论文已经被 CVPR 2022 接收。没有你们的支持和努力,这是不可能的。

b58e87e1e2250b16e57a3265e9b20dc2.png

当打开这个举报者的 YouTube 个人主页时,也不难发现这个昵称为 E2V-SDE(Parody)是一个新注册的账号,其目的很明确,就是为了举报 E2V-SDE 这篇论文不公的抄袭事件。截至目前,这条视频观看量达 11 万次。

在视频中,举报者将  E2V-SDE 这篇论文与先前其他团队发表的 10 多篇论文进行了对比,发现这篇所涉嫌抄袭的论文横跨“2018 年至 2021 年发表的多篇国际论文”。

如 E2V-SDE 这篇论文的第一章节中部分段落和 2019 年就已经发表的《Latent ODEs for Irregularly-Sampled Time Series》论文段落中的两处,几乎一字不差。

19e5c278f5ba50bef5025213806e8588.png

E2V-SDE 论文段落

cfe572bf7486712eaca7641802e75bd8.png

来自 2019 年发布的《Latent ODEs for Irregularly-Sampled Time Series》论文

34879d2a02493d818f85033e6a5834c0.png

E2V-SDE 论文段落

f150d392cc8d5fcc0a6435962c52d9ff.png

来自 2019 年发布的《Latent ODEs for Irregularly-Sampled Time Series》论文(https://arxiv.org/abs/1907.03907)

不止如此,该论文也与 2018 年发表的《Stochastic Adversarial Video Prediction》中的某些内容及其相似:

cc60d2f3e81be03121e35ce117129b22.png

E2V-SDE 论文段落

b9fc5bce250ee556c5a6a4d0a761f3b1.png

来自 2018 年发表的《Stochastic Adversarial Video Prediction》论文(https://arxiv.org/abs/1804.01523)

更甚的是,E2V-SDE 论文中某一整段的内容包括计算公式,似乎都是来自更久之前(2021 年)发表的多篇论文中的段落拼接版本:

55ff7db67793e73b43683c4b7bd7d263.png

E2V-SDE 论文段落

b8e18a865e6cd2d2d052fbca77c985a5.png

来自 2021 年发表的《Continuous Latent Process Flows》论文段落(https://arxiv.org/abs/2106.15580)

ed0888a2917b3ff4b913755f5e416273.png

来自 2021 年发表的《Efficient and Accurate Gradients for Neural SDEs》论文段落(https://arxiv.org/abs/2105.13493)

daff5b35ebed3d821ceb2b50339b09c1.png

来自 2021 年发表的《Continuous Latent Process Flows》论文段落(https://arxiv.org/abs/2106.15580)

经过举报者的核对对比,E2V-SDE 这篇原文共计有 40 多处与其他论文中的段落一样,几乎覆盖每个章节,和大段文字、公式等内容。如果说是合理引用其他论文的内容,但是论文并没有明确说明这一点,而且涉及内容之多很难不会被界定为“剽窃”他人研究成果。

3c4af42f35979bf3058a90b846502247.png

E2V-SDE 论文段落

eabccd4161e9c90829dc4e6ca343f51c.png

来自 2021 年发表的《Continuous Latent Process Flows》论文段落(https://arxiv.org/abs/2106.15580)

581c65b73313322aa7f5184f4eef39bb.png

E2V-SDE 论文段落

65e350c1ffcd4fdc5b983df77a3fb1b9.png

来自 2021 年发表的《Continuous Latent Process Flows》论文段落(https://arxiv.org/abs/2106.15580)

0ec396b80fb0e369a16baa7660d14fc2.png

究竟是谁动了"抄袭"的手?作者的推「锅」之战

他人多年的研究成果,以论文形式公开发表,却遭到抄袭,最终“合成式”的文章却登上了 CVPR Oral,听起来不乏有些讽刺之意。

对此,气不过的举报者也在 Twitter 进行了下一步,其在视频的介绍中,分享了每个时间点涉及 E2V-SDE 抄袭的论文名字。

44f094e91c39098467885005e2d641a1.png

并在 Twitter 上扮演起了抄袭者的身份,主动 @ 相关被抄袭论文的作者,让其看看自己被抄袭的论文内容,统一用的话术便是,「Hey,你好。感谢您的 XXXX 论文,我们非常喜欢它,以至于我们将几乎所有的 XXXX 章节内容复制到了我们的 #CVPR2022 论文中」。

6fdacf5ffb0a981a8e54f799f1d7a7ff.png

此波连续的操作下,也让 E2V-SDE 的作者们有些猝不及防,甚至开启了一波“互撕”。

在这条的 Twitter 评论下,有一位@byunggookna 的作者回应道,“我真的为这个荒谬的事情道歉。作为这篇论文的合著者,我应该检查一下这篇论文的抄袭。尽管我根本没有想到第一作者会如此抄袭,但我对此深感责任。我真的再次道歉。”

65cb1405611fd0133c64d01b163946e1.png

据悉,E2V-SDE 撰写这篇论文的研究团队由著名的首尔大学的 Sungroh Yoon 教授领导,他也是这篇论文的通讯作者(课题的总负责人)。其实验室中的一名博士生为论文的第一作者(对研究工作做出最大贡献的人员),另外,这篇论文还有三位合著者(共同创作同一作品、共同对文献的知识内容或艺术内容负责的两个或两个以上的责任者)。

据韩国媒体报道,Yoon 在接受当地媒体采访时并不知道抄袭事件,其后来补充说道,抄袭是学生的“个人行为”。他说,他将呼吁首尔大学举行纪律委员会听证会。而后,在 6 月 25 日,Yoon 在与媒体的通话中承认了“剽窃”的事实,并解释道,“论文不是单独写的,而是多人分角色,按部分合并使用,收集的第一作者没有如实反映其他合著者提交的内容,而是把之前发表的论文贴在了一起。”

此时,第一作者成为了主要责任人,也成为了众人关注的重点人物。

不久后,在这条 Twitter 下方,第一作者@jw00112233 出面回复道,“这篇论文的所有问题完全是我的,第一作者。我完全接受所有批评是正确的。我同意抄袭是绝对不可原谅的信念,我将接受任何纪律处分,没有任何借口。”

31b9acc89f70dc9119fe69f0282bef4a.png

同时,他还表示,“我们已将其转发给 CVPR。对于给所有研究人员带来的不便,我们深表歉意。所有这些行为都是个人的偏差,所以如果你不对我所属的群体和合著者进行鲁莽的批评,我将不胜感激。”

11d4799e80047b2ddaec819eb7f53d2a.png

对此,CVPR 官方也回应了此事,“本文已提交 IEEE 进行官方调查。它也将尽快先做删除处理。”

3bb914167cddb727b72de24f3e2f1278.png

不过,让网友颇感好奇的是,“但凡查个重也不至于这样”,这也不禁让人质疑 CVPR 大会接收论文时候的审核机制。

CVPR 也迅速做出回应,并附上了 IEEE 的官方定义,「IEEE 将抄袭定义为在未经明承认原作者和来源的情况下,重复使用他人的研究过程、结果、文字。对于所有 IEEE 的作者而言,重要的是要认识到,任何形式、任何程度的抄袭都是不可接受的,这会被视为严重违反专业的行为,并可能存在严重的道德和法律后果。」

a0b192634460d454ce88e58cf9c0c7d3.png

另外,首尔大学周日表示,其研究诚信委员会将从周一开始调查此事,以进行进一步调查。

针对以上的系列回复,不少网友也表示不解;

  • 我不明白为什么通讯作者(监督教授)把所有的责任都归咎于第一作者!什么样的教授在作为通讯作者参与时,没意识到这些类型的公然抄袭???

  • 合著者就是来分享荣誉的,而不是一起担责的?

  • 撤回论文似乎没有达到可以让事情平息的程度。指导教授,包括第一作者在内,希望大家自愿承担责任和罚金。特别是,我认为有必要在大学里正式进行纪律处分。

也有论文作者表示,这或许只是冰山一角,如果其他的论文查阅者,经验不够丰富,积累不够多,或许根本发现不了这种抄袭行为。因此,如果想要杜绝这种行为,也只能靠各位论文作者自身的修养,其他办法只能做一些外在的约束罢了。

参考链接:

相关的视频内容:https://www.youtube.com/watch?v=UCmkpLduptU

https://www.reddit.com/r/MachineLearning/comments/vjkssf/d_how_to_copy_text_from_more_than_10_previously/

https://news.koreadaily.com/2022/06/25/society/generalsociety/20220625041928707.html

https://www.reddit.com/r/MachineLearning/comments/vjkssf/d_how_to_copy_text_from_more_than_10_previously/​​​​​​​

— 推荐阅读 —

二十年前,《 程序员》创刊时,我们要全面关注软件人的成长。今天,我们依然初心不变:在一行行代码的背后,是一颗颗鲜活的开发者想要改变世界的雄心壮志。因此,《 新程序员 004》从 C++之父 Bjarne Stroustrup、C# 之父 Anders Hejlsberg、MySQL 之父 Michael "Monty" Widenius、PostgreSQL 全球开发组联合创始人 Bruce Momjian 等程序员祖师爷,到阿里巴巴副总裁贾扬清、指令集创始人兼董事长潘爱民、Vue.js 作者尤雨溪……48 位技术大咖,共创我们的程序人生、我们的技术时代。《 新程序员 004》已全面上市,欢迎订阅!

 

Logo

20年前,《新程序员》创刊时,我们的心愿是全面关注程序员成长,中国将拥有新一代世界级的程序员。20年后的今天,我们有了新的使命:助力中国IT技术人成长,成就一亿技术人!

更多推荐