每3篇就有1篇涉嫌造假?中国癌症研究遭遇“最大规模”质疑

日期:2026-02-08 18:50:07 / 人气:27



36%、17万——这两个数字,成为中国科研界无法回避的焦点。2026年1月30日,《英国医学杂志》(The BMJ)发表的一项研究揭示:1999-2024年间发表的中国癌症研究论文中,超17万篇被AI标记为疑似论文工厂产物,比例高达36%。这意味着,每3篇中国癌症研究论文中,就有超过1篇可能存在诚信问题。  

一、全球扫描:论文工厂渗透学术金字塔顶端

这项由澳大利亚昆士兰科技大学Adrian Barnett教授主导的研究,扫描了全球260万篇癌症论文,发现26.1万篇(9.87%)疑似论文工厂产物,其中中国占17.7万篇(68%)。研究采用BERT机器学习模型,通过分析论文标题和摘要的文本特征,在已知真假论文中达到91%的准确率。  

关键发现包括:  
• 时间趋势:论文工厂问题呈指数级恶化。1999-2009年标记率约1%,2022年升至15%(每10篇癌症论文中1.5篇疑似造假),2022年后略有下降,或与出版商反击、论文工厂转向AI生成新模板有关。  

• 期刊层级:高影响因子期刊(前10%)的标记率从1999年接近零,攀升至2022年的10%以上。顶级期刊也未能幸免,说明论文工厂已渗透学术金字塔顶端。  

• 全球分布:中国标记率36%(全球平均9.87%的3.6倍,美国的18倍);伊朗(20%)、沙特(16%)、埃及(15%)等国也较高,但中国因科研体量庞大,绝对数量最突出。  

二、AI如何识破论文工厂?模板化生产的“文字指纹”

论文工厂(paper mills)是批量制造虚假论文的“学术合同作弊组织”,依赖预制句子模板,替换领域术语后流水线生产。其收费与期刊影响因子挂钩(影响因子越高,售价越高)。  

Barnett团队的核心发现是:论文工厂的文本模板会延伸至标题和摘要,形成独特的“文字指纹”。通过训练BERT模型分析数千篇真假论文,AI学会了识别这种“造假腔调”。模型在验证集上准确率91%-93%,敏感性87%,特异性96%-99%,甚至能识别未训练的错误核苷酸序列和细胞系问题论文,证明其确实捕捉到了论文工厂的文本特征。  

三、中国癌症研究的“重灾区”特征

中国癌症研究论文的造假问题呈现以下特点:  
• 领域偏好:胃癌(22%)、肝癌(20%)、骨癌(21%)论文标记率最高,与中国这些癌症的高患病率相关;基础研究(癌症生物学、治疗开发等)是重灾区(标记率超10%),因数据易伪造;临床研究(流行病学、支持性护理)标记率低(<2%),需真实患者数据。  

• 细胞系异常:BGC-823、BEL-7402等错误识别的细胞系几乎只出现在中国机构论文中,暗示论文工厂针对性瞄准“需求旺盛”领域。  

• 出版商分布:Verduci Editore旗下期刊标记率67%(主要来自《European Review for Medical and Pharmacological Sciences》);Springer Nature、Elsevier、Wiley等主流出版商标记率约10%,分别涉及4万、近4万、2.8万篇论文。  

四、“标记≠造假”:统计工具的局限与警示

研究强调,“标记”是AI基于文本特征的统计预测,不等同于“确认造假”。模型灵敏度87%、特异性96%-99%意味着:若真实论文工厂比例为10%,被标记论文中约70%为真造假,30%可能误判。以中国17.7万篇被标记论文为例,若假阳性率30%,则约5.3万篇可能被误判,但仍有12.4万篇疑似真实造假。  

此外,论文工厂原产国可能与作者国籍不同(如俄罗斯论文工厂向39国售文),因此“中国作者”不直接等于“中国造假”。但研究指出,中国因科研体量、发表压力等因素,仍是论文工厂的最大市场。  

五、根源:“发表或消亡”文化的恶性循环

研究诊断,论文工厂泛滥的核心是“publish-or-perish”(发表或消亡)文化:研究者需高影响因子论文满足晋升要求,论文工厂瞄准高影响因子期刊抬高售价,形成“需求-供给”恶性循环。癌症研究因“高发表压力、易伪造数据、有限同行评审”更易受影响。  

六、中国科研的警钟与转机

36%的标记率虽可能被误判部分,但即便按30%假阳性率计算,真实造假比例仍可能达25%(每4篇1篇造假)。这对中国科研的国际声誉、全球癌症研究方向及恪守诚信的研究者均造成冲击。  

但希望犹存:64%的中国癌症论文未被标记,说明绝大多数科研人员坚守诚信。中国科研面临关键选择:若延续现有路径,“劣币驱逐良币”将加剧;若改革评价体系(从数量到质量)、重建学术诚信文化(倡导“慢科学”),或可扭转局面。  

研究呼吁技术检测(AI工具)、制度改革(评价体系)、文化重建(“慢科学”)三管齐下。Barnett警告:“不作为将导致出版系统崩溃,阻碍科学进步。”对中国而言,36%既是警钟,更是转机——问题已被量化,解决路径清晰,现在需要决心与行动。  

(数据与引用均来自2026年1月30日《英国医学杂志》研究论文及Adrian Barnett系列文章。)

作者:耀世娱乐注册登录官网




现在致电 TG:xylmwohu OR 查看更多联系方式 →

耀世娱乐-耀世注册登录官网 版权所有