大模型之家讯 4月15日,OpenAI正式发布了GPT-4.1系列模型,包括GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。这一系列被称为“有史以来最小、最快、最便宜”的模型,在编码能力、指令遵循和长文本理解等方面均超过了前代模型GPT-4o和GPT-4o mini。所有模型均通过API提供,现已对所有开发者开放。

性能优化:编码、指令遵循与长文本理解
GPT-4.1系列在多个关键能力上实现了显著提升。在编码方面,GPT-4.1在SWE-bench验证测试中得分54.6%,较GPT-4o提升了21.4%,较GPT-4.5提升了26.6%。在指令遵循方面,GPT-4.1在MultiChallenge基准测试中得分38.3%,较GPT-4o提升了10.5%。在长文本理解方面,GPT-4.1在Video-MME基准测试中得分72.0%,较GPT-4o提升了6.7%。

成本与延迟:更经济的选择

GPT-4.1系列模型在成本和延迟方面也表现出色。对于中等规模的查询,GPT-4.1的价格比GPT-4o低26%。对于重复使用相同上下文的查询,OpenAI将提示缓存折扣从之前的50%提高到了75%。此外,GPT-4.1 nano被称为OpenAI最快、最经济的模型,适用于对延迟较为敏感的场景。
未来展望:构建复杂智能体的可能性
OpenAI表示,GPT-4.1系列模型的性能提升将为开发者构建智能系统和复杂的智能体应用开辟新的可能性。这些模型可以在现实世界的软件工程、从大量文档中提取见解、以最小的人工干预解决客户请求以及其他复杂任务方面发挥作用。
随着GPT-4.1系列的发布,OpenAI将开始在API中弃用GPT-4.5预览版,计划于2025年7月14日关闭。这一举措显示了OpenAI在推动模型轻量化和性能优化方面的持续努力。
原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/9896