萧箫发自凹非寺
量子位报道公众号 QbitAI
投稿到顶会,结果被审稿人暗示要引用他的文章?
不仅要在参考链接里引用,而且还要加进内文甚至标题?
以往遇到这种突如其来的“问候”,论文作者为了发表文章,大多只能忍气吞声。
好消息是,目前两名来自美国俄克拉荷马州医学研究基金会(OMRF)的生物信息学家开发出了一种检测方法,可发现科学家蓄意操纵论文引用的行为。
不测不知道,一测吓一跳,通过分析 PubMed 数据库中的公共记录,他们发现,大约在 2 万名科学家中,竟然有80 人涉嫌极度歪曲他人的引用模式。
也就是说,这 80 人很有可能是强迫他人引用自己文章的“嫌疑犯”。
两位文献计量学家在看过这篇研究后,表明“这项研究虽然还没有经过同行评审,但从技术上来看,这种方法应该是正确的。”
似乎再也不用发愁被审稿人「强迫引用」了。
高被引的检测原理
从这次的检测情况来看,研究者们利用 PubMed,从每篇论文中获取作者姓名、发表的期刊名称以及编号,据此进行引用分析。
研究者们剔除了一部分名称含糊的作者(例如不写全名的),避免发生「误伤」。
其中,引用论文的方式主要分为引用自己的论文(自引,SC)和引用他人的论文(非自引,NSC)两种,这里研究者主要针对非自引论文的行为进行调查。
毕竟,相对于疯狂引用自己的论文来说,强迫他人引用自己的行为更加恶劣。
然后,他们选择采用NSC 基尼系数(Gini Index)来衡量那些被引用学者的非自引情况。
嗯,基尼系数?
听起来有点熟悉,这不是衡量国家收入分配情况的嘛?
的确如此,如果贫富差距越大,那么一个国家的基尼系数也就会越大。
不过,这个系数的计算方式对在一个学者的论文引用数量上,也有一定的道理。
如果一个学者平时的论文基本无人问津,然而却在某一个期刊的某几篇文章中,出现了大量被引用的情况,相较于平均值来说,他的 NSC 基尼系数就会诡异地变高。
例如,一位来自希腊的肿瘤学家 Dimitrios Roukos,他的 NSC 基尼系数就非常不正常。
从 2009 年到 2014 年,Roukos 在一本名为《外科内窥镜》的期刊中获得 71 篇论文的近 2000 次引用,每项研究均引用了他的工作约 20–30 次,而且这些论文都由他的同事或导师撰写。
目前,Roukos 没有针对此事进行回应。
「强迫引用」学术圈背后
还记得今年二月,知名美籍华人学者、生物物理和生物信息学家周国城被 2 个期刊编委会开除的事情么?
据 Nature 报道,周国城在担任 JTB 编委期间,审阅投稿论文时要求作者引用自己的文章、甚至将他开发的一种算法名称加入论文标题,以提高曝光度,最多的时候超过50 篇,截至被开除时,他的论文被引次数超过58000 次。
值得注意的是,另一本国际学术期刊《生物信息学》(Bioinformatics)在 2019 年年初就禁止了周国城继续参与期刊的论文审稿,但当时并没有公开他的姓名。
对此,周国城回应称,自己在论文中提到的算法不是“审稿人的强迫引用”,而是因其高效性而被许多用户所认可使用。
但周国城绝非个案。
调查表明,大约有1/5的研究者经历过被“强迫引用”的情况。
对此,论文作者希望编辑和审稿人能开发一个数据库,明确在同行评审中,数据库内增加了哪些资料。
此外,为提高论文引用率,频繁自引的情况也屡见不鲜。
但除此之外,作者也指出,不应该单纯以论文引用数量来定义论文质量、或是给作者相应奖励。
“这种现象,才是从根本上需要改变的。”
作者介绍
论文一作 Jonathan D. Wren,毕业于德克萨斯大学西南医学中心,目前是 OMRF(Oklahoma Medical Research Foundation)实验室的一员,这是一所独立的、非营利性的高水平生物医学研究机构。
目前,Wren 也是《生物信息学》期刊的副编辑。
而另一位作者 Constantin Georgescu,同样是博士,毕业于罗马尼亚多瑙河下游大学,目前也是 OMRF 实验室的一员。
论文链接:
https://www.biorxiv.org/content/10.1101/2020.08.12.248369v1.full.pdf
参考链接:
https://mp.weixin.qq.com/s/lCOsnmViR-D4ZOO9Cs4ySg
https://www.nature.com/articles/d41586-020-02378-2