[id_1920325142]
2.21
知识分子
The Intellectual
图源:pixabay
撰文 | 张天祁
01
中国医院占据前三名
近日,《自然》杂志发布了一份研究报告。这份报告首次从机构层面展开,对全球论文撤稿现象进行了系统性分析。
在《自然》所统计的“撤稿率最高机构”范畴里,中国山东济宁市第一人民医院凭借超过 5%的撤稿率(2014 至 2024 年),成为了世界上撤稿率最高的科研机构。该医院平均每发表 20 篇论文,就会有 1 篇被撤回,其撤稿率比全球平均水平高出 50 倍还多[1]。
数年前,济宁市第一人民医院就出现了大规模的学术不端事件。2020 年,加州的学术诚信调查员伊丽莎白·比克发现了 400 多篇论文,这些论文内容高度雷同,疑似来自统一的论文工厂,且几乎全部来自中国的几十家医院,其中济宁市第一人民医院的论文数量最多,超过 100 篇[2]。
事件曝光之后,《澎湃新闻》有报道称,济宁市第一人民医院从 2021 年 9 月 7 日至 2022 年 1 月 21 日期间,陆续发布了 10 份通报。这些通报涉及 107 篇论文以及 107 起学术不端事件。对于相关责任人,分别给予了院内通报批评、科研诚信诫勉谈话、党内警告、行政警告、免职等处理措施[3]。
在新的自然研究里,河北沧州市中心医院和河南大学淮河医院分列撤稿率榜单的二三名,撤稿率大概是 3.5%。在撤稿率前十的机构中,有七席是中国机构,且这些机构都是医院或者医学院。除了前面提到的三家医院外,潍坊市人民医院、临沂市人民医院、新乡医学院第一附属医院、齐齐哈尔医学院也进入了前十。印度 KPR 工程技术学院占据一席。
图源:
《自然》的撤稿分析所依据的数据来自三家研究诚信公司:Scitility 的 Argos、Research Signals 的 Signals 以及 Digital Science 的 Dimensions Author Check。这些公司把 Retraction Watch 的数据库进行了整合,同时也整合了 Crossref 的出版数据、PubMed 的索引以及期刊网站信息,从而构建了全球撤稿数据集。
不同数据来源得出的结果存在差异,然而机构撤稿具有一些共性规律,其中中国小型医院和医学院一直处于主导地位。
根据 Dimensions 的数据,在撤稿率超过 1%的 136 家机构里,大概 70%是中国机构。在这些中国机构中,接近 60%是医院或医科大学。Argos 数据库统计的 186 家撤稿率 1%以上的机构,也有着相同的规律。对不同类型机构进行分析后表明,中国医院的撤稿率普遍比高校要高,它属于撤稿率最高的一类机构。
医院是学术不端现象较为严重的地方。在 2023 年国家自然科学基金委第一批不端行为案件处理结果通报里,8 起案例当中有 7 起的当事人都来自各医院、医学院以及医科大学。而在 2023 年的第二批通报中,也有三分之一的案例与医院、医学院有关。一项研究基于 2015 年至 2020 年国家自然科学基金委员会的通报数据。该研究显示,在被处理的人员中,专业为生物医药类的占比约 75.9%[4]。
一项研究显示,通过人工智能算法可识别论文工厂的论文。起初,论文工厂每年的产量仅为几篇,到 2014 年已达到每年上百篇,而从 2018 年起更是飙升至每年上千篇。在 SCI 收录的论文里,医院是论文工厂产出论文的主要出处,所占比例高达 67.5%。对全球医院发表的 SCI 论文进行进一步分析后,几乎所有的论文工厂论文都来源于中国的医院[5]。
这些医院所暴露的问题具有高度相似性。年轻医生为了满足职业晋升对于论文的要求,没有办法,只得从“论文工厂”那里购买伪造的数据,或者直接发表伪造的论文。伊丽莎白·比克指出,这些医生正承受着巨大的压力,原因在于他们必须发表论文,这样才能获得工作或者晋升。
《知识分子》以往关于撤稿问题的文章里,一位青年研究人员曾介绍,很多省份的卫健委规定评职称需要论文,并且有极为严格的计分方式,这不仅仅是篇数的问题,还会考核影响因子。近些年来,只有广东等少数地区不再将论文当作评职称的必要条件。
很多人对掠夺性期刊进行斥责。然而,很多医生却没有办法,因为他们必须要发表论文才能评定职称,所以只能甘愿被掠夺。从根本上来说,原因或许还是那种逼迫良善之人做出不当行为的制度。这位学者表示[6]。
02
谁是撤稿大国
过去 10 年的撤稿数量经统计后,不少排名前列的是中国机构。然而需注意的是,仅统计过去 5 年(2020—2024)的撤稿数量,印度和沙特阿拉伯的几家科研机构在榜单中占主导地位,这是由于它们在 2023 年 Hindawi 的撤稿潮中受到了更为显著的影响。
2023 年,Hindawi 发布了数量超过 9600 篇的撤稿声明,撤稿数量达到了前所未有的程度。本次《自然》的研究报告表明,Hindawi 是撤稿的重点区域,其旗下有 4 种期刊从 2014 年开始撤稿率超过 20%,还有 4 种撤稿率超过 10%,在期刊撤稿排行榜中处于最靠前的位置。
部分中国科研人员参与了这些撤稿论文。2024 年初,因受到此次撤稿事件的影响,教育部科学技术与信息化司发布了通知。通知要求各高校开展撤稿论文的自查工作,要全面检索中英文科技文献数据库,对过去 3 年来本单位以及本人署名(包括第一作者、通讯作者)的科研论文被撤稿的情况进行全面梳理,核实论文撤稿的原因,并且要严惩学术不端行为。
教育部的撤稿自查通知强调,这些撤稿行为以及其他出版商的撤稿行为对我国的学术声誉和学术环境带来了负面的影响。
撤稿数量在很大程度上与机构和国家的体量有关。在 2014 至 2024 年间,全球范围内过去十年发表的 5000 万或更多篇文章中,有大约 4 万篇(不到 0.1%)被撤稿。从撤稿率来看,中国学者参与的撤稿论文占比近 60%(逾 2 万篇),但排在前列的撤稿概率并不突出。目前中国整体撤稿率约为0.3%,三倍于全球平均水平。
埃塞俄比亚的撤稿率比中国高,沙特阿拉伯的撤稿率也比中国高。不同数据源显示,伊拉克的撤稿率与中国相当,巴基斯坦的撤稿率与中国相当,俄罗斯的撤稿率也与中国相当。美国的撤稿率约为 0.04%,英国的撤稿率约为 0.04%,它们远低于全球 0.1%的平均水平,许多国家的撤稿率比它们还要低。总体而言,中国的撤稿率大致在第 3 到第 5 之间。
撤稿的原因,或许是无心之失,或许是编辑上的错误。然而,有证据表明,多数案例与学术不端行为相关。《自然·人类行为》今年年初的一篇评论文章经调查显示,20.5%的中国撤稿论文和论文工厂存在关联[7]。
03
仍在增长的撤稿
撤稿并非大概率事件。在 2014 到 2024 年间,撤稿声明的增长在加速。2014 年公告数量不到 2000,到 2023 年超过 12000。一方面是论文工厂兴起导致的,另一方面是学术侦探发现了更多问题。
2014 年到 2022 年期间,论文撤稿率呈现出明显上升的态势。2022 年发表的论文撤稿率约为 0.2%。2023 年和 2024 年的撤稿数据看似较低,这可能是由于这两年发表的论文尚未经过足够时间来暴露问题。一般而言,论文的撤回需要一定时间,例如几年后才会被察觉并撤回。
全球撤稿率在持续上升,然而已曝光的问题或许只是冰山的一角。法国图卢兹大学的计算机科学家纪尧姆·卡巴纳克觉得,某些领域或机构撤稿率较低,有可能只是因为它们避免去对存在的问题展开调查。
纪尧姆在去年发表于《自然》的评论文章里,介绍了自己研发的用于检测学术论文中“扭曲短语”(Tortured phrases)的工具。在人工智能生成或者经过多次翻译以逃避抄袭检测的论文中,可能会出现一些难以理解的短语。
人工智能被翻译为伪造意识或者人造脑力。前段时间,中国有一篇论文,其摘要(Abstract)被误译成了抽象(Pumping elephant),然后这篇论文被撤稿了,它也犯了这类错误。因为在一些翻译软件中,Abstract会被译成“抽象”,而将“抽象”两个字拆开来翻译成英文时,就出现了Pumping elephant这种让人看不懂的词。
如果一篇文章存在多个这类错误,那么造假的可能性会非常高。在 2023 年 8 月 20 日的时候,纪尧姆开发的工具已经找出了 16000 篇引用了 5 个或更多这类扭曲短语的论文,然而被撤稿的仅占 18%[8]。
催生畸高撤稿数量和比例的,可能是鼓励发表的短视政策。
印度的自由数据科学家阿查尔·阿加瓦尔是印度研究观察组织(IRW)的创始人。他发现,印度高撤稿率的机构几乎都集中在教育重镇泰米尔纳德邦的私立院校,这与他的分析相符合。他认为,印度公立大学和政府机构的研究人员所面临的发表压力比私立机构小。私立机构不但鼓励学生和教师多发论文,在某些情形下还会为发表论文给予奖金。
阿加瓦尔在 2024 年 1 月发布的预印本论文里,曾对撤稿观察数据库中 25 个国家的撤稿数据做了简单研究。他发现,在过去五年中,论文出版数量与撤稿声明率呈现高度正相关。那些发文数量大量增长的国家,撤稿率往往也会迅速提升。虽然相关不能等同于因果,但不健康的激励制度很可能是导致高撤稿率的主要原因。
这使人对当下重数量轻质量的激励制度产生了质疑。阿加瓦尔写道[9]。
麻省理工科技评论在 2020 年指出了一个惊天的学术造假事件。有 400 余篇论文或许来自同一“论文工厂”,并且这些论文还涉及数十家中国医院。
贾利略在 2022 年指出,济宁市第一人民医院 10 月有 6 篇论文被撤,这些论文存在编造研究过程以及代写代投的情况。《澎湃新闻》对此进行了报道。
陈宾宾和薛建龙在 2022 年进行了关于高校科研诚信总体情况的实证分析以及治理建议的研究。该研究基于国家自然科学基金委员会 2015 至 2020 年的通报案例,其研究成果发表在 2022 年第 9 期的《今日科技》杂志上,页码为 66 至 68 页。
邸利会在 2022 年提出疑问,为何中国医疗界治不了自己论文造假这个“病”?此观点发表于《知识分子》。
张天祁在 2024 年指出了中国掀起撤稿自查风暴背后的情况。《知识分子》对此进行了相关报道。
Xu 和 Hu 在 2025 年针对应对中国的退缩危机展开研究。他们的研究成果发表在《自然·人类行为》上。
Agrawal 在 2025 年进行了 2022 年至 2024 年的国家层面的撤稿分析。出版量的增加导致了更高的撤稿率。
本文采摘于网络,不代表本站立场,转载联系作者并注明出处:http://www.mjgaz.cn/fenxiang/274394.html