摘要:学术诚信正面临前所未有的挑战。美国克利夫兰诊所病理学家马克·哈卢什卡的一项调查发现,2024年诺贝尔生理学或医学奖获奖领域——微小核糖核酸研究已成为大规模论文造假活动的重灾区。一篇发表于2018年、标题仅为"MicroRNA"的综述文章因其在搜索引擎中的显著位
学术诚信正面临前所未有的挑战。美国克利夫兰诊所病理学家马克·哈卢什卡的一项调查发现,2024年诺贝尔生理学或医学奖获奖领域——微小核糖核酸研究已成为大规模论文造假活动的重灾区。一篇发表于2018年、标题仅为"MicroRNA"的综述文章因其在搜索引擎中的显著位置,被论文工厂大量引用,目前引用量已超过2000次,其中至少18篇引用论文已被撤稿。
这一发现揭示了现代学术出版系统的深层脆弱性:搜索算法的排名机制如何被恶意利用,以及新兴热门研究领域如何成为学术不端行为的温床。更令人担忧的是,数据分析显示,引用该综述的论文中超过80%来自中国研究机构,暴露了学术诚信问题的地域集中性。
搜索排名效应的意外后果
这篇引发关注的综述发表在爱思唯尔旗下的《过敏与临床免疫学杂志》,作者为美国芝加哥大学医学部的托马斯·卢和辛辛那提儿童医院的马克·罗滕伯格。文章本身在学术内容上并无问题,主要综述了微小核糖核酸在过敏疾病研究中的应用前景。
然而,这篇综述的异常之处在于其在谷歌学术搜索中的显著地位。当研究人员搜索"miRNA"关键词时,这篇文章consistently出现在搜索结果的第一位。哈卢什卡认为,这种搜索排名的prominence正是导致文章被异常高频引用的关键因素。
"当那些对miRNA一无所知,只是从事论文工厂生意的人需要引用该领域的一篇主题综述时,他们会直接选用第一条搜索结果,"哈卢什卡解释道。他在最近评审的一篇明显出自论文工厂的稿件中再次发现了对这篇综述的引用。
这种现象反映了数字时代学术研究的一个意外副作用:搜索引擎算法的排名机制可能被恶意利用,成为学术造假的工具。论文工厂operators利用研究人员对便捷性的依赖,系统性地引用高排名文献来增加其伪造论文的表面可信度。
更深层的问题是,这种引用模式的系统性和机械性暴露了论文工厂的运作特征。legitimate研究人员通常会基于文献的相关性和质量来选择引用,而论文工厂则倾向于使用标准化模板,导致某些文献被异常频繁地引用。
撤稿数据揭示的规律
"撤稿观察"网站研究员戴维·罗伯特·格莱姆斯对这一现象进行了系统分析。在爱思唯尔Scopus数据库中,共有2046篇论文引用了这篇综述,其中18篇已被撤稿。虽然撤稿比例看似不高,但撤稿原因的集中性引人关注。
大多数撤稿通知都cite了数据重复使用和同行评审问题作为主要理由,这些通常是论文工厂产品的典型特征。论文工厂为了提高产量和降低成本,经常重复使用实验数据、图像和文本段落,这种做法在经过仔细审查后容易被发现。
综述文章截图
一个典型案例是2021年被撤稿的一篇发表在《国际免疫药理学》的论文。该论文作者来自山东大学齐鲁医院、山东省妇幼保健院和山东第一医科大学第一附属医院。撤稿声明中,作者承认"在未充分完成研究工作的情况下就发表了该论文",这种表述暗示了研究工作的不完整性或虚构性。
格莱姆斯的分析还发现了期刊层面的模式。引用该综述最多的期刊是MDPI旗下的《国际分子科学杂志》,共52次引用。引用次数第二多的是Taylor & Francis旗下的《生物工程》期刊,有39次引用。值得注意的是,《生物工程》期刊因为难以清除论文工厂内容,已在今年早些时候失去了Web of Science的收录资格,并于7月暂停接收新投稿。
地域集中性的担忧信号
格莱姆斯对引用该综述的作者所属机构进行的地理分析揭示了一个令人担忧的模式:引用频率最高的20所大学全部位于中国,超过80%的引用来自中国研究机构的作者。这种地域集中性far超过了该领域研究活动的正常分布。
这一发现与近年来关于中国学术界论文工厂问题的报道相符。多项独立调查显示,论文工厂在中国的活动particularly活跃,部分原因与该国的学术评价体系和职业晋升要求密切相关。在一些机构中,研究人员的晋升和奖励directly与其发表论文的数量挂钩,这种激励结构inadvertently促进了论文工厂的市场需求。
"撤稿观察"联系了20篇引用该综述论文的作者,仅有一人回复。这位回复者是重庆大学附属中心医院的钮柏琳,他曾在哈佛大学做博士后。钮柏琳解释说,他们引用这篇综述是因为它"是一篇简洁、广受欢迎的综述,概述了miRNA在免疫和过敏疾病背景下的生物学功能"。
钮柏琳的回应代表了legitimate使用该综述的情况,但其他19位作者的silence可能暗示了不同的情况。在学术不端调查中,当事人的沉默often是一个concerning信号。
热门领域的脆弱性
微小核糖核酸研究之所以成为论文工厂的目标,与其作为热门研究领域的地位密切相关。2024年诺贝尔生理学或医学奖的颁发further提升了该领域的visibility和prestige,使其成为更具吸引力的造假目标。
论文工厂专家、澳大利亚新南威尔士州卫生署的詹妮弗·伯恩指出,那些批量生产科学论文的实体可能已将这篇综述的引用纳入了可重复使用的模板中。她解释说,如果这种情况属实,引用该综述的论文可能会出现意想不到的相似性,或者引用显得"不合理"。
伯恩的观察揭示了论文工厂运作的一个关键特征:standardization。为了提高效率和降低成本,论文工厂倾向于使用标准化的模板,包括固定的引用列表、实验设计和文本结构。这种standardization虽然提高了生产效率,但也成为识别其产品的重要线索。
更广泛地说,这一事件反映了现代科学出版系统面临的challenges。随着科学研究的全球化和数字化,传统的质量控制机制正在受到新型造假方法的挑战。搜索引擎算法、自动化工具和全球化的学术labor market都在ways被恶意利用,这些问题需要publishing community的collective response。
该事件也highlight了学术评价体系改革的urgency。当前以论文数量为主导的评价体系为论文工厂创造了市场需求,而转向以质量和影响力为导向的评价模式可能有助于减少这类问题的发生。
来源:人工智能学家