AI开展原创研究?OpenAI科学家称AI今年内或可近乎自主地产出成果

编辑丨coisini
2022 年,OpenAI 最广为人知的产品 ChatGPT 问世,此后 OpenAI 又发布了一系列前沿人工智能工具,包括采用逐步「思考」流程、专精逻辑推理任务的模型。这些工具已帮助研究人员润色文章、编写代码、综述文献甚至生成假设。
与其他科技巨头一样,OpenAI 面临着模型能耗和训练数据使用方式的争议。不同于部分企业的是,OpenAI 几乎只发布研究人员可用但不可修改的专有模型。这给 OpenAI 的 AI 技术添上了一抹神秘感。
最近,《Nature》就 AI 能否产生原创科学、通用人工智能(AGI)发展及 OpenAI 即将发布的开放权重模型等问题采访了 OpenAI 首席科学家 Jakub Pachocki。Pachocki 2017 年加入 OpenAI,2024 年起担任首席科学家。

ScienceAI 对《Nature》访谈内容进行了不改变原意的编译、整理,内容如下。
科学家们越来越多地使用推理模型,五年后这些模型可能发挥什么作用?
目前,你可以与模型对话,但它只是一个需要持续引导的助手。我预计这一点将发生根本性改变。
我们已经看到,像 OpenAI 的「Deep Research」(一种能整合海量信息的工具)这样的系统,能在无监督状态下运行 10-20 分钟并产出有用成果。但目前用于解决这些查询的计算资源仍然很少。
对于开放性研究问题,值得投入更多计算资源。我预计未来 AI 将真正具备开展新颖研究的能力。例如,我们将在自主软件工程、硬件组件的自主设计等领域看到重大进展,其他学科也会有类似应用。
强化学习在 OpenAI 推理模型的开发中有多重要?
初代 ChatGPT 的发布包含无监督预训练阶段,模型通过吸收海量数据构建一种「世界模型」。随后,我们通过强化学习结合人类反馈,提炼出实用的助手。
你会发现我们真正增强了强化学习阶段的作用 —— 我们不仅是在提取某种能力,更是在让模型发展出自己的思维方式。
问题在于,我们是否还应将这些学习阶段割裂看待。推理模型并非在真空中学会思考,它们植根于通过预训练习得的模型。我重点思考这一阶段,并尝试融合不同方法、理解其相互作用。
你提到模型「思考」,模型真的在推理吗?还是说它们只是在模拟类似推理的过程?
有一点必须明确:模型的运作方式与人脑不同。经过预训练的模型虽然学会了关于世界的某些知识,但它并不真正理解自己是如何学会的,也不清楚学习这些知识的时间顺序。
但我确信,我们有充分证据表明模型能够发现新颖的洞见。可以说这是一种推理形式,但这并不意味着它与人类的推理方式相同。

Jakub Pachocki
OpenAI 首席执行官 Sam Altman 表示,公司将很快发布自 2019 年 GPT-2 以来的首个开放模型。你能透露相关计划吗?
我非常期待,尤其是向研究人员提供开放权重模型(可供下载并进一步训练)。随着模型能力的提升,我们越来越有责任理解不同部署方式对人类的影响。
出于安全考虑,我们很难开放前沿模型的权重。我希望发布的模型能超越现有开源模型。
你对通用人工智能(AGI)的定义是什么?你认为我们何时能实现它?
我的时间预期和定义都已发生重大变化。读研时,我认为 AI 攻克围棋是实现 AGI 的里程碑,并以为这需要数十年。但 2016 年 AlphaGo 的胜利彻底颠覆了我的认知。
2017 年加入 OpenAI 时,我仍对实现 AGI 抱有怀疑,但里程碑的达成速度远超预期。我们在图灵测试上取得巨大进展,随后是数学和问题解决能力的突破,预计最难的标准也将很快被超越。
因此,我现在关注的下一个重大里程碑是 AI 产生可量化的经济影响,尤其是开展原创研究的能力。这最接近我过去对 AGI 的感性认知。这是我们专注的方向,预计本年代末将取得实质性进展。甚至今年,AI 就可能近乎自主地产出有价值的软件成果 —— 虽然未必能解决重大科学问题。
原文链接:https://www.nature.com/articles/d41586-025-01485-2