OpenAI重磅发布全新AI模型o1，开启AI“慢推理”时代

志斌 • 2024年9月13日上午10:55 • 人工智能

大模型之家讯 9月13日，经过长达半年的研发，OpenAI正式发布了其全新AI模型o1，标志着人工智能领域迈入一个全新的时代。这一新模型的代号为“草莓”，但在正式亮相时，它被命名为“OpenAI o1”。OpenAI对此解释道：“在复杂推理任务中，这是一项重大突破，代表了人工智能能力的新高度。因此，我们将计数器重置为1，并将这一系列命名为OpenAI o1。”

此次发布的o1模型在推理能力和逻辑处理方面取得了显著进展，以至于OpenAI决定摒弃沿用已久的GPT系列命名，开创了一个全新的“o系列”。业内人士纷纷感叹，这一举动不仅震撼了AI领域，更预示着AI行业正式进入了新的发展阶段。

在各种高难度的测试中，o1的表现堪称惊艳。在AIME 2024数学竞赛中，o1预览版的准确率高达56.7%，而正式版更是达到了83.3%，相比之下，GPT-4o的准确率仅为13.4%。此外，在代码竞赛中，o1正式版的准确率达到89%，远超GPT-4o的11%。尤其是在博士级科学问题（GPQA Diamond）测试中，o1的表现达到了78%，不仅超过了GPT-4o的56.1%，还超越了人类专家水平的69.7%。

o1模型之所以能取得如此成就，核心在于其采用了Self-play RL（自我博弈强化学习）技术。这一技术使得o1能够自我学习、反思并纠正错误，同时能够将复杂问题分解为更易处理的步骤。当某个方法无法奏效时，o1还能够尝试不同的解决方案。这种能力类似于人类“慢思考”的思维模式，正如诺贝尔经济学奖得主丹尼尔·卡尼曼在其著作《思考，快与慢》中所描述的那样：慢思考是一种更为缓慢、逻辑性强且需要更高认知能力的思维方式，而这正是AI未来迈向AGI（通用人工智能）的关键一步。

借助这些突破性的推理能力，o1在处理科学研究、代码编写、数学推导等复杂任务时展现出巨大的潜力。例如，o1可以为医学研究人员注释细胞测序数据，帮助物理学家生成复杂的量子光学公式，并辅助开发者构建多步骤工作流程。o1还具备数据飞轮效应，每个正确答案都可以形成一个包含正负奖励的小型数据集，进一步加速模型的自我优化。

目前，OpenAI已开始逐步向ChatGPT Plus和Team用户开放o1模型，并提供了两个版本：o1预览版和o1-mini。o1-mini是一个更加轻便、速度更快且更具经济效益的版本，特别适合处理数学和代码等需要推理但不依赖广泛世界知识的场景。

对于开发者而言，o1的API服务现阶段仅向已支付超过1000美元的开发者开放，且每分钟最多调用20次，显示出这一新模型的高昂成本。API的定价为o1预览版每百万输入15美元，输出60美元，o1-mini的价格则相对便宜，输入3美元，输出12美元。不过，相较于GPT-4o，o1的推理能力和精度的飞跃，已经让众多开发者对未来的降价充满期待。

o1的推出，不仅将推理能力提升到了新的高度，也预示着AI未来发展中，人类与智能机器之间的界限将越来越模糊。

首先，o1的推理能力大幅超越以往的模型，为解决复杂的科学研究、数学推导和代码编写等领域中的棘手问题提供了更强大的工具。

其次，o1通过引入类似人类“慢思考”的思维方式，显著提升了AI在处理多步骤、逻辑性任务时的表现，这将推动AI应用从简单的自动化处理扩展到高层次的认知推理。

在大模型之家看来，o1的成功标志着人工智能正在迈向AGI的关键节点，意味着未来AI将能够在更多专业领域中扮演重要角色，彻底改变传统行业的工作流程与生产力。AI技术的不断进化不仅将赋能各类产业，还可能引发新一轮的行业创新，促使更多企业加速拥抱智能化的未来。

原创文章，作者：志斌，如若转载，请注明出处：http://damoai.com.cn/archives/7239