随着人工智能(Artificial Intelligence, AI)技术特别是大模型的快速发展,AI给生活和工作的方方面面带来便利,其中也包含科学研究。但论文和插图本身所要表达的观点是否可以由AI生成?在相应的监管和应对体系未建立之前,是否允许AI生成科学材料并用于发表?本文从下面两个典型案例出发,与大家一起探讨上述备受关注的问题。
案例1
2024年2月13日,英文学术期刊Frontiers in Cell and Developmental Biology(该期刊目前影响因子为5.5, 是中科院2区期刊)发表了一篇题为《Cellular functions of spermatogonial stem cells in relation to JAK/STAT signaling pathway》的论文。在这篇论文中,来自西安红会医院和西安交通大学的三位研究人员总结了目前有关精子干细胞的研究。他们还展示了一个绝对巨大的、解剖学上完全不正确的、人工智能生成的老鼠阴茎(图1)。
除了AI生成的这只老鼠,还有三张据称描绘了复杂信号传导途径的图。虽然这些图形初看起来没有卡通老鼠那么明显,但它们同样被AI生成的无意义的胡言乱语所包围。这些怪异的数字组合在一起,迅速在社交媒体上引起了学者们的关注,人们纷纷质疑这些明显不准确的数字是如何通过期刊的审查程序的。
虽然许多研究人员都提醒不要在学术文献中使用AI生成的材料,但Frontiers出版社的政策并不禁止作者使用AI工具,只要他们适当声明即可。在这个案例中,作者明确表示他们使用了Midjourney的人工智能图像生成器来制作图表。不过,该期刊的作者指南Author guideline指出,使用这些工具制作的图表必须经过检查,以确保其准确性,而在本案中显然没有这样做。
该期刊称,论文作者没有回应审稿人要求他们修改图表的请求。现在,Frontiers声称正在开展调查。据报道,其中一位审稿人说他们只是根据文章的科学价值进行了评审,并声称,纳入AI生成数据的决定最终是由Frontiers出版社编辑做出的。此后,该期刊发布了全面撤稿声明(图2),称这篇文章“不符合Frontiers编辑和科学严谨性的标准”。在随附的一篇博文中,Frontiers说已经从数据库中删除了这篇文章和其中AI生成的数据,以保护科学记录的完整性。
科学诚信专家伊丽莎白-比克(Elisabeth Bik)花了大量时间来审查学术期刊中被篡改的图像,她将该图描述为一个“可悲的例子”,说明了AI生成图像是如何利用评审漏洞的。尽管这个“老鼠阴茎图”很容易被检测出来,但比克警告说,它的发表可能预示着未来会出现更多类似存在问题的论文。比克在她的博客“科学诚信文摘”(Science Integrity Digest)上写道:这些图形在科学上显然是不正确的,如果这种拙劣的插图能如此轻易地通过同行评审,那么看起来更逼真的AI生成的图形很可能已经渗透到科学文献中了。生成式AI将对科学论文的质量、可信度和价值造成严重损害。
案例2
与AI生成的巨大阴茎老鼠图相似,另一篇论文中的解剖图也因AI生成图像错误在社交媒体上引起关注而被撤回。这篇于2024年7月12日发表在Lippincott's出版社的期刊Medicine题为《Assessment of the efficacy of alkaline water in conjunction with conventional medication for the treatment of chronic gouty arthritis: A randomized controlled study》的论文描述了一项随机对照试验,该试验发现碱性水可以减轻疼痛并缓解慢性痛风性关节炎的症状。这篇文章因“数据完整性和一个不准确图片引起了关注”而被撤稿(图3)。
比克和包括托马斯-凯斯曼(Thomas Kesteman)在内的研究人员在“图片打假平台”PubPeer上表达了担忧。比克指出,论文图中小腿和手臂的骨骼数量有误,并且有一些无意义的标注,如“chlsinkestead atlvs no ctivktty greuedis”和“Aliainine jerve sreiter”(图4)。她还注意到数据的不一致性和研究方法的似乎不切实际。
凯斯曼还强调了其他问题:文章中的一些参考文献没有出现在PubMed或谷歌学术中,作者的电子邮件地址也不是机构的。此外,一些统计分析结果“几乎是不可能的”。凯斯曼说,表格中的疼痛评分数据“呈现的模式在现实生活中是不可能找到的”。
摩根-普菲夫纳(Morgan Pfiffner)是营养和补充剂研究在线数据库Examine.com的研究员,他首先注意到了这项研究,并发布了文章中的错误图片。普菲夫纳告诉撤稿观察平台“Retraction Watch”:“这张图太荒谬了。”另一位学者发现该论文的引言(Introduction)100%是由AI生成的。
Medicine的一位发言人说,该杂志正在不断改进其编辑审稿流程。他们说:“我们正在与其他领先的出版商合作,致力于同行评审并使用新技术,在此基础上采取一系列举措,帮助塑造良好的医学研究评审环境。”
学术期刊不允许AI生成材料?
全球每年在线发表的学术论文超过500万篇,几乎无法估量研究人员使用AI生成图像的频率。去年,Nature发表了一份措辞强硬的声明,称不允许任何AI生成的图片或视频出现在其期刊上。Science也声明,出版的系列期刊未经编辑许可,不得使用AI生成的文字、图像或数字。Nature编辑部表示,该决定是经过几个月的商议后做出的,主要原因是在验证用于生成AI内容的数据方面存在困难。编委会还对图片生成者无法适当地为艺术家的作品署名表示担忧。
负责开发这些工具的AI公司目前正在与来自艺术家和作家的一系列诉讼作斗争。这些艺术家和作家称这些工具非法生成了根据受版权保护的材料训练出来的图像。除了归属问题外,生成式AI工具还倾向于配上文字,生成与事实或概念不符的图像。在其他方面,研究人员警告说,AI生成图像可能会被用来制作逼真的假图像,也被称为深度伪造图像,他们说这可能会被用来为错误的数据或不准确的结论提供可信度。所有这些因素都给希望发表AI生成材料的研究人员或期刊带来了挑战。
有不少期刊明确表示,出于维护学术诚信和研究透明性的目的,不接受作者署名中包含AI工具的论文投稿,同时参考文献中也不应包含将AI列为作者的论文。作者必须是能对论文内容的真实性、完整性、科学性等负责的自然人。如论文主要内容是利用AI工具生成,一旦发现,将以学术不端行为处理。
Nature编辑部去年写道:“世界正处于AI革命的前夕,这场革命蕴含着巨大的希望,但AI,尤其是生成式AI,也在迅速颠覆科学、艺术、出版等领域长期以来形成的惯例。这些约定俗成的惯例如保护科学诚信、保护内容创作者免受侵害的体系经过了几个世纪才形成。如果我们在处理AI问题时稍有不慎,所有这些成果都有可能付诸东流。”
与其禁止,不如规范AI使用?
不过,这也并不是要将AI视作洪水猛兽,更多人表示,针对论文写作中原创性要求不高、重复性强的部分,比如数据收集、文献参考、罗列提纲、投稿格式等方面,借助AI未尝不可,反而可能更好地提升内容的产出效率。
有期刊提到,论文写作中如果使用了AI工具和AI生成内容,包括利用AI工具收集和分析数据、制作图片或论文中的图形元素、生成程序算法、文本或进行文字润色等,须在论文的数据来源、方法设计或结语部分明确说明使用了何种AI工具、详细使用过程,以及其作用和贡献,以便审稿人和编辑部对论文的原创性进行评判。
AI应用目前还是处于论文写作的“灰色地带”。随着AI工具的发展,未来可能依然会发生类似的事件,不过这也间接凸显了开放科学的价值,以及读者自由参与学术研究过程、监督论文发表过程的重要性,从而确保学术研究的透明度和可信度。此外,有关部门应尽快建立起相应的使用AI辅助工具的指南和规范,从而可以更合理、正确地使用AI。总之,远离学术不端,呈现高质量的学术研究,是所有科研人员、管理机构以及科学出版从业者应该始终积极坚持和共同努力的目标。