大模型之家讯 9月13日,经过长达半年的研发,OpenAI正式发布了其全新AI模型o1,标志着人工智能领域迈入一个全新的时代。这一新模型的代号为“草莓”,但在正式亮相时,它被命名为“OpenAI o1”。OpenAI对此解释道:“在复杂推理任务中,这是一项重大突破,代表了人工智能能力的新高度。因此,我们将计数器重置为1,并将这一系列命名为OpenAI o1。”
此次发布的o1模型在推理能力和逻辑处理方面取得了显著进展,以至于OpenAI决定摒弃沿用已久的GPT系列命名,开创了一个全新的“o系列”。业内人士纷纷感叹,这一举动不仅震撼了AI领域,更预示着AI行业正式进入了新的发展阶段。
在各种高难度的测试中,o1的表现堪称惊艳。在AIME 2024数学竞赛中,o1预览版的准确率高达56.7%,而正式版更是达到了83.3%,相比之下,GPT-4o的准确率仅为13.4%。此外,在代码竞赛中,o1正式版的准确率达到89%,远超GPT-4o的11%。尤其是在博士级科学问题(GPQA Diamond)测试中,o1的表现达到了78%,不仅超过了GPT-4o的56.1%,还超越了人类专家水平的69.7%。
o1模型之所以能取得如此成就,核心在于其采用了Self-play RL(自我博弈强化学习)技术。这一技术使得o1能够自我学习、反思并纠正错误,同时能够将复杂问题分解为更易处理的步骤。当某个方法无法奏效时,o1还能够尝试不同的解决方案。这种能力类似于人类“慢思考”的思维模式,正如诺贝尔经济学奖得主丹尼尔·卡尼曼在其著作《思考,快与慢》中所描述的那样:慢思考是一种更为缓慢、逻辑性强且需要更高认知能力的思维方式,而这正是AI未来迈向AGI(通用人工智能)的关键一步。
借助这些突破性的推理能力,o1在处理科学研究、代码编写、数学推导等复杂任务时展现出巨大的潜力。例如,o1可以为医学研究人员注释细胞测序数据,帮助物理学家生成复杂的量子光学公式,并辅助开发者构建多步骤工作流程。o1还具备数据飞轮效应,每个正确答案都可以形成一个包含正负奖励的小型数据集,进一步加速模型的自我优化。
目前,OpenAI已开始逐步向ChatGPT Plus和Team用户开放o1模型,并提供了两个版本:o1预览版和o1-mini。o1-mini是一个更加轻便、速度更快且更具经济效益的版本,特别适合处理数学和代码等需要推理但不依赖广泛世界知识的场景。
对于开发者而言,o1的API服务现阶段仅向已支付超过1000美元的开发者开放,且每分钟最多调用20次,显示出这一新模型的高昂成本。API的定价为o1预览版每百万输入15美元,输出60美元,o1-mini的价格则相对便宜,输入3美元,输出12美元。不过,相较于GPT-4o,o1的推理能力和精度的飞跃,已经让众多开发者对未来的降价充满期待。
o1的推出,不仅将推理能力提升到了新的高度,也预示着AI未来发展中,人类与智能机器之间的界限将越来越模糊。
首先,o1的推理能力大幅超越以往的模型,为解决复杂的科学研究、数学推导和代码编写等领域中的棘手问题提供了更强大的工具。
其次,o1通过引入类似人类“慢思考”的思维方式,显著提升了AI在处理多步骤、逻辑性任务时的表现,这将推动AI应用从简单的自动化处理扩展到高层次的认知推理。
在大模型之家看来,o1的成功标志着人工智能正在迈向AGI的关键节点,意味着未来AI将能够在更多专业领域中扮演重要角色,彻底改变传统行业的工作流程与生产力。AI技术的不断进化不仅将赋能各类产业,还可能引发新一轮的行业创新,促使更多企业加速拥抱智能化的未来。
原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/7239