GPT-5开源？那只是奥特曼的“烟幕弹”

在2024年即将到来的时刻，OpenAI CEO山姆·奥特曼（Sam Altman）在X社交平台发表推文，汇总了用户对于OpenAI呼声最高的需求点。

包括：

AGI（请耐心等待）

GPT-5

更好的语音模式

更高的费率限制

更好的GPT

更好的推理

对工作/行为程度的控制

视频

个性化

更好的浏览

“使用OpenAi登录”

开放源代码

作为被《时代》杂志评为“2023年度CEO”，山姆·奥特曼的一条推文瞬间成为了轰动整个AI行业的信号。尤其是万众期待的“GPT-5”与“开源”同时出现在这张表单时，更是被一些人错误解读成为了“OpenAI在2024年的发展目标，是将GPT-5开源”。

然而大模型之家发现，山姆·奥特曼这则推文中的内容仅仅是汇总了“行业的呼声”，这虽然可能会是OpenAI现阶段关注的方向，但如果将其解读为“企业发展目标”，还是多少有失偏颇。

更何况，在大模型之家看来，即使OpenAI真的推出GPT-5，可能性其实并不大。

为商业，GPT开源可能性渺茫

虽然大模型开源可以促进GPT模型的创新和发展、开源可以增加大模型的透明度和可信度、让更多的人参与到人工智能的研究和实践中，扩大大模型的影响和普及。然而，在开源世界中，如何实现商业化始终是困扰行业的难题，而目前行业通常采取的做法是通过部分开源的方式，将核心竞争力的代码进行闭源，再通过闭源部分实现商业化。

大模型之家曾指出，行业内，常常把大模型的开源与闭源的争论，类比为移动互联网时代的Android与iOS之争。例如OpenAI的GPT-4和百度的文心一言至今则坚持闭源，Meta则选择了开源的道路，相继面向“学术研究用途”开源了LLaMA和LLaMA-2模型，而百川智能在学术领域选择了开源7B、13B两种尺寸的大模型，商业探索上将53B闭源，以保护商业利益和技术的竞争优势。

GPT的闭源，为OpenAI带来了可观的收入。据The Information报道，OpenAI CEO山姆·奥特曼对员工表示，公司正以每年13亿美元（约合人民币94.93亿元）的速度产生收入，平均每月收入超过1亿美元，比去年全年2800万美元增长超过450倍，达4542%，也比三个月前预期的年收入高30%。这也让2023年成为OpenAI公司成立8年来，收入增长最快的一年。

然而，在OpenAI快速增长的背后，其巨额的成本却往往被行业所忽略。公开信息显示，2022 年，OpenAI开发GPT-4，仅训练成本支出约5.4亿美元。2023年4月，SemiAnalysis 的一项研究表示OpenAI每天为ChatGPT支付的运营成本约694.4万美元（主要是电费），年化运营成本约为2.5亿美元，综合年化成本可能超过13亿美元，这意味着OpenAI或仍处于亏损状态。

对于商业模式上，OpenAI官网文章中明确指出：我们（OpenAI）打算继续免费提供ChatGPT，并从选择付费的高级服务的用户和企业中获得收入。考虑到开发和提供大模型的高成本，我们（OpenAI）的组织目前并不盈利，也不指望在近期内盈利——我们（OpenAI）的目标仍然是广泛而安全地让人工智能的好处惠及全世界。

虽然OpenAI嘴上说着“不指望在近期内盈利”，但生存问题仍然是其不得不面对的挑战。2022年OpenAI非营利实体2022年收入仅4.5万美元，倘若没有商业化维持，OpenAI恐怕很快会迎来破产。

2023年11月，OpenAI公司董事会突然宣布罢免首席执行官山姆·奥特曼引发的动荡引起广泛关注。虽然在一系列风波后，山姆·奥特曼重返CEO职位，但行业对于风波背后的诱因的猜测中，不乏对于董事会认为山姆·奥特曼追求激进的商业化运营策略，违背了OpenAI的核心价值观的指摘。

而通过GPT-4闭源获得大量收入的OpenAI，显然没有充足的理由将GPT-5完全开源，这无异于自毁壁垒，在大模型赛道的竞逐中丧失领先优势。

为生态，部分开源仍存可能

在大模型之家看来，对于开源而言，虽然GPT-5开源的可能性极为渺茫，但是为了GPT相关生态建设，关于GPT相关的工具集开源的可能性却很高。结合“OpenAI计划下周推出GPT商店，用户可销售和共享聊天机器人”的消息，OpenAI会通过部分开源的方式，为开发者的开发、调试、分享提供便利，并通过社区的方式，接受社区的反馈和建议，不断完善和更新其GPT模型和平台。

时至今日，坚持完全开源的企业凤毛麟角，多是采用部分开源的方式，对于OpenAI而言，部分开源是一种明智的选择，既能够让更多的人参与到GPT相关生态建设中，促进社区的发展和壮大，又能够保护公司的核心技术和商业利益。

除此之外，在山姆·奥特曼的关注点中，语音、视频等大模型的多模态输出能力，也成为行业呼声大，且OpenAI发力的重点，2023年10月，GPT4推送了vision相关的功能——GPT-4V，展示了出色的图像与视频识别能力，让行业对其在图像、视频处理与自动驾驶领域的应用充满期待。ChatGPT的也在9月首次上线语音对话功能，并于11月面向全部用户开放。

OpenAI对于大模型多模态能力的关注，恰恰与大模型之家近期发布的《2024人工智能产业趋势预测》不谋而合。大模型之家指出：模态生成式AI是指能够处理多种媒体数据（如文本、图像、音频等）的AI技术。多模态生成式AI发展提速，音、视频大模型将成为发展新风口多，在2024年，多模态生成式AI的研发和应用将加速发展，推动音视频大模型的产业化应用。通过多模态生成式AI技术，人们将能够更加自然地与AI系统进行交互，实现更加高效、便捷的人机交互体验。同时，多模态生成式AI技术也将为创意产业带来新的发展机遇。

生态与商业化，这两者一直以来都是人工智能行业发展的核心要素，无法回避。在这个行业中，技术和应用的发展需要有一个健康的生态环境，以便为其商业化进程提供必要的支持和保障。同时，商业化的成功也离不开生态环境的建设，因为只有在一个良好的生态环境下，技术才能得到更好的应用和推广，进而推动整个行业的持续发展。

在人工智能行业中，生态与商业化是相互促进、相互依存的关系。只有在一个良好的生态环境下，商业化才能得到更好的发展；同时，商业化的成功也可以为生态的发展提供必要的支持和保障。因此，对于OpenAI而言，想要行稳致远，同样注重生态与商业化的平衡发展。

原创文章，作者：志斌，如若转载，请注明出处：http://damoai.com.cn/archives/2928