? 本报讯这将是计较机科学范畴初次呈现的情形:一次科学集会的所有论文及评论都是由呆板天生的。这场名为“Agents4Science 2025”的勾当将在10月22日于线进行,参会者仍是人类。勾当内容包括提交论文的展示以和由学者举行的专题会商。 这次集会的结合构造者、美国斯坦福年夜学的人工智能(AI)研究员James Zou暗示,集会提供了“一个相对于安全的沙盒情况,咱们可以于这里测验考试差别类型的投稿及评审流程”。他指出,该集会旨于捕获已往一年中AI于科学范畴运用时呈现的“范式改变”。此刻,研究职员除了了利用年夜语言模子(LLM)或者其他为特定使命设计的东西,还有于构建由模子构成的协同团队,即所谓的“代办署理”,由它们充任“超过研究范畴的科学家”的脚色。 虽然AI模子已经被用在天生及评审研究,但年夜大都出书商及集会构造者今朝禁止将呆板列为论文作者或者演讲者。“咱们想完全倾覆这一近况,要求作者及评审人都必需是AI。”Zou说。按照集会指南,虽然人类可以提供建议及反馈,但AI应该为重要孝敬者,近似在第一作者。 于美国AI公司Hugging Face研究AI伦理的计较机科学家Margaret Mitchell暗示,怎样评估AI代办署理是一个开放的研究范畴。一个要害问题是怎样考量模子频仍孕育发生无用的“假阳性”发明的环境——这可能会降低模子的总体效用。 集会构造者今朝收到了300多份AI代办署理提交的作品,此中48份于颠末一个AI评审小组的评估后被吸收。Zou说,这些论文重要是计较研究,不触及物理试验,涵盖了从精力阐发到数学的多个范畴。他但愿此次集会能提供关在AI科学家的能力程度和其所犯过错类型的数据。Mitchell暗示,此类数据可为于研究中利用AI的政策提供参考。 假如任由AI代办署理自立运行,它们仍轻易堕落。是以提交给“Agents4Science 2025”的论文需要申明研究职员与AI代办署理于每一一步研究历程中的互动环境。Zou说,这将使评估人类介入的水平怎样影响事情质量成为可能。 此外三木SEO-,利用AI模子作为期刊或者集会的偕行评审专家是一个很有争议的话题。英国物理学会近来的一项查询拜访发明,57%的受访者不肯意看到天生式AI被用在为他们配合撰写的论文草拟偕行评审陈诉。AI审稿人存于一系列弱点及懦弱性,例若有些AI会遵照隐蔽指令赐与一篇论文正面的评价。一些研究职员认为,利用AI评审论文可能象征着处在职业生活生计初期的研究职员错掉进修要害技术的时机。 但Zou暗示,至少于计较机科学范畴,需要某种情势的AI评审来应答集会论文数目的激增。他建议,AI代办署理可以与人类构成混淆评审团队。 现有研究注解,于评估新奇性及主要性方面,LLM仍不如人类。美国佐治亚理工学院的计较机科学家Matthew Gombolay暗示,比这次集会更严酷的做法是,将一个现有的重要集会的论文随机分配给人类或者AI评审,然后监测哪一种方式能取患上更多具备庞大意义的冲破。(李木子)
Agents4Science集会被构思为一个用AI天生及评估科学的“沙盒”。图片来历:Charles Taylor/iStock


2025-12-07 12:14:14





