用AI查出造假学术论文?不足半年,12批医生论文造假名单曝光!

近期,国家卫健委、科技部、国家自然科学基金委员会接连曝光医生论文造假名单:北京协和副主任论文造假、某历史超120年的医院发生大批医护人员论文造假、山东省占据近期国家卫健委造假名单的80%、两起国自然评委翻车事件、1人拖累6所高校等。

针对这一情况,12月1日,科技部发布了《科技部关于近期查处的论文造假有关情况的通报》


通报内容如下:


科技部关于近期查处的论文造假有关情况的通报
日期:2021年12月01日 16:53  来源:科技部 

今年以来,科技部、教育部、卫生健康委等部门依托科研诚信建设联席会议建立联合工作机制,对发现的涉嫌造假论文组织开展调查,并进行常态化通报,目前已公布了12批235篇造假论文的查处结果。


近期,联合工作机制又组织相关部门和论文作者所在单位查处了119篇造假论文,已按程序对293名责任人作出处理。现将查处的总体情况通报如下,具体处理结果将由作者所在单位和相关主管部门陆续向社会公布。

按照联合工作机制的统一部署,涉事论文作者所在单位积极履行主体责任,认真开展调查,并经牵头部门核查、联合工作机制复核,查明119篇论文分别存在编造研究过程、伪造篡改研究数据、论文买卖或代写、伪造通讯作者邮箱、不当署名等一种或多种违背科研诚信要求的问题。


依据《科研诚信案件调查处理规则(试行)》,对相关责任人作出了撤销学位、职称和荣誉称号,取消申报项目资格,追回奖励奖金等处理。其中,撤销学位的9人;撤销职称的20人;取消一定年限晋升职务、职称资格的156人;追回获取奖励奖金、撤销荣誉称号的42人,合计追回奖金46万余元;取消一定年限申报科技计划(专项、基金等)项目资格的255人。


以上相关违规事实及处理决定已记入科研诚信管理信息系统。调查中发现的从事论文买卖、论文造假的中介机构问题线索,科技部已同步转相关主管部门予以查处。


为加大对论文造假的查处力度,科技部还建立了主动发现机制,开发了智能工具,对近年发表的学术论文开展监测分析,及时发现论文中的学术不端问题线索,交相关主管部门和单位依规调查处理。

医生论文造假现状


让我们先关注一下医生论文造假现状。今年科技部公布的第一批医学科研诚信案件调查处理结果发布与6月8日,今天是12月4日,尚不足半年。不到半年就通报了12批235篇造假论文,这个数量想必瑞典政府甘拜下风。



9月份Nature报道:瑞典政府的反学术不端机构被2020年46起相关案件调查工作淹没,这是他们预期案件数量的3倍。


在近期的119起论文造假案件中,涉事的293人里只有20人被撤销职称,还有156人是取消一定年限晋升职务、职称资格的。医生选择论文造假的一个重要原因是什么大家都懂的。


撤销学位的有9人,还有人被医院或大学限制考研考博,不过可能因为这部分的总人数过少,所以科技部未在的统计数据中展示。


追回获取奖励奖金、撤销荣誉称号的42人,合计追回奖金46万余元;取消一定年限申报科技计划(专项、基金等)项目资格的255人


能使用AI查论文造假?


小编注意到了一个比较特别的点:在通报最后科技部宣布“为加大对论文造假的查处力度,科技部还建立了主动发现机制,开发了智能工具,对近年发表的学术论文开展监测分析,及时发现论文中的学术不端问题线索,交相关主管部门和单位依规调查处理。


这个为建立的主动发现机制所开发的“智能工具”应当就是我们日常所说的AI,人工智能。虽然使用AI不是什么稀奇事,不过科技部选择走这步棋的确出乎意料。


实际上在科技部之前许多大型出版商都已经开始尝试使用智能工具来对抗学术不端。出版商Springer Nature 早在2015年就开发论文造假检测软件——最初级的AI。


在10月底爆出有骗子冒充客座编辑诈骗SCI杂志编辑部时,Elsevier 就表示它正在开发开源计算机化工具,从而实现计算机标记论文何时包含自动生成的了“学术论文”。Springer Nature 也表示,他们同样在开发人工智能工具,用于识别和防止故意操纵系统的情况。


AI检测学术不端,靠谱吗?


小编我有一个研究人工智能的朋友曾说过一句业内的大实话:“现有的人工智能都是人工智障。”


毕竟现阶段受限于科技发展水平,我们能研发出来的人工智能都是弱人工智能,也可以叫做人工弱智能,缩写人工弱✲,别名……都懂。以我们身边最常遇到的AI为例,他们基本是这样的:


常用社交平台、小说网站、某些网游的不良词汇检测AI对“不良”词汇做出屏蔽。


靠在妈□□病床上→靠在妈妈的病床上
双手虎□□握→虎口交握
→公鸡


图片来源于网络


至于医学人、科研狗更痛恨的论文查重系统则经常出现:通红的实验数据专有名词参考文献


是的,实验结果数据都能给标红,比如检测结果是含量3.3微克,3.3这个数字可以跟一个八竿子打不着的石油研究里的3.3ml被检测为数据重复(小编当年的亲身经历)


所以基本可以肯定的是:科技部开发的这个智能工具可以对近年发表的学术论文开展监测分析。但是分析结果中一定存在大量的“假阳性”,也会有大量的“假阴性”逃脱。但考虑到我国科研论文的体量,使用智能工具筛选出一批涉嫌学术不端的论文,再从“假阳性”中找出真正的造假论文是一个事半功倍的选择。小编也相信这个智能工具已经在实际工作中发挥了它应有的作用。


不过,小编有看到部分媒体已经开始鼓吹科技部使用自己研发的智能工具在近期查处了119篇造假论文!


不是的!


早在11月初的通报刚出来的时候小编就曾怀疑过,地区如此集中,案件如此密集的发生,是不是因为端了一个论文工厂?


后来小编翻到了去年的一份消息:在2020年,2月24日,职业学术“打假人”Elisabeth Bik及其团队发现了超过400篇来自不同作者和机构的非“灌水刊”论文,其标题、图片(特别是 Western blot 的图版上)极其相似,似乎都是由同一个论文工厂产生的,极有可能存在伪造数据的情况。



巧合的是,这些论文几乎全部来自中国的几十家医院,其中不乏三甲级性质的。其中,被质疑造假论文数量最多的是6家地方三甲医院


1.济宁市第一人民医院(三甲):101 篇论文(几乎没有重复作者,涉及到儿科 15 篇、心脏病学 6 篇、内分泌学 6 篇、肾病学 6 篇、血管外科 5 篇等不同科室);
2.吉林大学中日联谊医院(三甲):59 篇论文;
3.青岛大学附属医院(三甲):23 篇论文;
4.临沂市中心医院(三甲):16 篇论文;
5.郑州大学第一附属医院(河南最大的三甲):16 篇论文;
6.济宁医学院附属医院(三甲):12 篇论文


据统计,在这400多篇文章中,最早的论文发表于2016年,而大部分论文发表于 2018-2020年,多数论文发表在以下6本期刊,影响因子在2-5之间,其中,Cellular Physiology and Biochemistry 已于 2019 年 1 月被踢出 SCI。同时,涉及Wiley、Elsevier等多家出版社。



在此次论文造假事件中,Bik总结出了来自论文工厂文章的四大特征:Western Blot 条带相似、流式细胞图雷同、柱状图风格接近、标题结构模版化。


增强对比后,背景图高度相似


相似的流式图


柱状图风格接近


论文标题结构模版化


paper工厂标题生成器:分子名称+动词+一到两个细胞过程+一种癌症或细胞类型+连接词+动词+一个miRNA(或通路、蛋白质)的名称

出现在近期发布的通报中虚假论文里,除了部分文章能与Elisabeth Bik去年挂出来的内容相印证,同时小编还发有一部分论文与Journal of Cellular Biochemistry在10月初发布的撤稿特刊中的被撤稿论文重合。在该撤稿特刊中编辑写明了撤稿原因,论文标注的撤稿原因与科技部通告中所述的学术不端行为一致。

至于说这是经过了1年的调查最终查实了论文工厂的存在?还是说之前鸡蛋校长事件,查处背后论文工厂时,拔出萝卜带出泥,证实了之前论文猎人的怀疑?这就只有实际相关方知道了。


版权声明

本文来源:解螺旋,中洪博元医学实验帮等

弗雷赛斯

-浙江大学硕博创建于2015年

查重润色 | 绘图 在线课程课题合作 SCI写作神器 期刊查询神器


让天下没有难做的科研–联系我们:[email protected]

未经允许不得转载:ai论文润色 » 用AI查出造假学术论文?不足半年,12批医生论文造假名单曝光!

评论 抢沙发

评论前必须登录!

立即登录   注册