阶跃 Step 3.7 Flash 拿下 Artificial Analysis 评测榜单多个第一,海外热度持续升温

大模型之家讯 全球权威大模型评测平台 Artificial Analysis 最新 Output Speed 榜单显示,阶跃星辰(StepFun)最新开源基座模型 Step 3.7 Flash 以 409 tokens/s 的输出速度位列主流模型第一,同时在端到端响应时长(End-to-End Response Time)、智能效率(Intelligence vs. Output Speed)与速度价格比(Output Speed vs. Price)等关键指标上均处于领先位置。

阶跃 Step 3.7 Flash 拿下 Artificial Analysis 评测榜单多个第一,海外热度持续升温
该图对比模型为 Artificial Analysis 官方默认选项
阶跃 Step 3.7 Flash 拿下 Artificial Analysis 评测榜单多个第一,海外热度持续升温
该图 Step 3.7 Flash 仅与其他同量级主流 Flash 模型进行对比
阶跃 Step 3.7 Flash 拿下 Artificial Analysis 评测榜单多个第一,海外热度持续升温
该图对比模型为 Artificial Analysis 官方默认选项
阶跃 Step 3.7 Flash 拿下 Artificial Analysis 评测榜单多个第一,海外热度持续升温

从行业趋势来看,大模型竞争正在从”单点能力”转向”Agent 真实任务效率”。在浏览、检索、文档理解、界面分析与工具调用等完整任务链路中,模型不再仅承担问答角色,而是作为持续执行的任务引擎运行,端到端时延、吞吐能力与成本结构成为核心约束。因此,更高吞吐、更低时延与更优成本效率的系统性平衡,正在成为 Agent 规模化落地的关键基础。

在这一背景下,Step 3.7 Flash 在智能效率比、端到端响应时长以及速度价格比等多项维度中均领先同档位模型,实现了智能、速度与成本的协同优化,为高频调用、持续运行、可规模化部署的 Agent 系统提供了基础能力支撑。这一趋势也进一步印证:Agent 时代的核心竞争力,正从”模型能力峰值”转向”真实任务完成效率”,本质是速度、智能与成本之间的系统性平衡。

与此同时,Step 3.7 Flash 自发布后登上 OpenRouter Trending 全球第二位,成为近期全球开发者社区关注度最高的开源模型之一。在开发者实测反馈中,该模型在运行效率、多模态理解以及 Agent 工具调用能力方面表现突出。有开发者将其与 DeepSeek V4 Flash 等同类模型对比后认为,其在速度、响应体验上具备明显优势。

综合来看,Step 3.7 Flash 在权威评测与开发者社区中的双重表现,一方面验证了其高吞吐与低时延的工程能力,另一方面也反映出中国开源模型正加速融入全球开发者生态,并在下一阶段 Agent 基础设施竞争中占据更重要的位置。

原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/15877

(0)
上一篇 1天前
下一篇 16分钟前

相关推荐

发表回复

登录后才能评论