分析NHANES数据库相关论文,很多研究了相同的暴露-结局组合

B站影视 韩国电影 2025-09-28 19:58 1

摘要:2025年9月2日,MedRxiv的一篇预印本探讨了冗余稿件(即多次提交相同或实质性重复稿件)的情况。研究发现,近年NHANES相关冗余稿件急剧增加,两年增长了17倍,现有针对冗余发表和抄袭的检查手段已不再适用。

2025年9月2日,MedRxiv的一篇预印本探讨了冗余稿件(即多次提交相同或实质性重复稿件)的情况。研究发现,近年NHANES相关冗余稿件急剧增加,两年增长了17倍,现有针对冗余发表和抄袭的检查手段已不再适用。

原文链接:https://www.medrxiv.org/content/10.1101/2025.09.09.25335401v1.full-text

研究背景

AI不仅可以用于科研中处理大型、复杂的数据资源,还可以绕过文本复用和抄袭的编辑检查,大规模制造冗余稿件或同时向多家期刊投稿。

本研究旨在调查生成式AI是否导致诚信检查失效。研究以NHANES数据库为主,调查其冗余稿件的发生情况,检验了冗余发表的普遍性,并且使用大型语言模型(LLM)重写现有稿件,测试其能否通过抄袭检查。

研究方法

稿件检索

以PubMed数据库为主要数据源,采用检索式"(nhanes[tiab] OR national health and nutrition examination survey[tiab])AND (("2021/01/01"[Date - Publication] : "2025/07/31"[Date - Publication]))",初步获得15,597篇文献。排除韩国NHANES、评论类文章、针对特定人群的研究(如癌症幸存者)。

暴露因素/预测因子与结局指标清单分别包含217个因素和162个结局,适时纳入替代指标。

在论文标题中检索并记录其中分析相同暴露-结局组合的多篇论文。经人工审查后,将以下研究判定为冗余稿件:分析相同暴露-结局组合,仅存在队列范围(如2014–2018年与2016–2020年)、性别(男性/女性)或年龄区间等差异。

图. 稿件检索及纳排流程

稿件生成和抄袭检查

选取已发表的3篇文章,由不同的人使用LLM生成“新稿件”,唯一要求是提示词必须明确指定新稿件需在句法上与原文不同以规避抄袭检测。人工检查并调整“新稿件”,每篇生成过程控制在2小时左右。

将其提交至iThenticate检测系统。根据Springer Nature关于Crossref Similarity Check/iThenticate的使用指南,研究将超过5%的单项相似度视为警示标志。

研究结果

最终确定411篇符合定义的冗余稿件,156个暴露-结局组合。2篇论文暴露-结局相同的情况最常见,最多达到6篇,出现在3个暴露-结局组合:氧化平衡评分与慢性肾脏病、身体圆度指数与女性不孕症、生命八要素与牙周炎。冗余的稿件可能发表在同一期刊,本研究中发生了67次。

图. 不同暴露-结局组合发生的次数

2023年之前与NHANES相关的冗余稿件极为罕见(2022年12篇,2021年3篇),而2024年达到198篇,两年内增长了17倍。

图. 不同时间的冗余稿件发表情况

这411篇冗余稿件由112个期刊发表,其中44%集中发表于五种期刊。最常使用的统计方法是在多重模型中逐步添加协变量的逻辑回归,其次为线性回归。

图.冗余稿件发表涉及到的期刊树状图(A)和其使用的统计学方法(B)

就上文提到冗余次数最多的三个暴露-结局组合生成“新稿件”,按理来说,这些组合更难规避抄袭检测。但三篇稿件的总体相似度均低于30%,且所有单项相似度均未超过5%,这表明这些稿件在期刊审稿流程中不会触发自动示警。

表.LLM生成的“新稿件”抄袭检测结果

抄袭和重复提交手稿等行为一直存在,且出版商及期刊采取了许多政策措施(国际出版伦理委员会近期发布的新版撤稿指南详见:),但在AI时代,这些措施已然不能满足审稿需求。

本研究发现,冗余稿件的发表数量急剧增加,而且某些期刊接受了过多的冗余稿件,这可能暗示着这些期刊已经成为论文工的目标,抑或编辑流程存在明显缺陷。LLM生成的稿件不仅没有在抄袭检查中得到警示,文中还没有扭曲短语(tortured phrases,识别问题论文的另一指标,详见)

冗余稿件还可能放大不良研究的影响,用数量的堆砌进一步影响相关领域的研究质量。

而且本研究仅仅描述了NHANES数据库,其他开放数据库也可能存在这种情况,或在NHANES因这些负面影响而发表受限后,被论文工厂视为下一个目标。(相关阅读:)

研究局限性

稿件无法区分研究人员因缺乏领域专业知识而未注意到同类研究,还是论文工厂故意采用多刊同投。

研究排除了针对特定数据子集的分析性研究,可能低估了问题的严重性。

研究仅使用LLM展示了示例性证据,并未对大量稿件进行全面分析以量化iThenticate等工具被"误导"的频率。

研究仅验证自动化检查,并不意味稿件可以通过编辑初审或同行评审进而发表。

当前提示词尚不能一键生成无误稿件,但人工修正LLM生成的基础错误平均仅需两小时。

研究结论

当前生成式AI时代,现有针对冗余发表和抄袭的检查手段已不再适用。

文章整理自:https://www.medrxiv.org/content/10.1101/2025.09.09.25335401v1.full-5

医咖会基础会员全面大升级,赶快去领取一年基础会员!

来源:白青科技论

相关推荐