智谱开源GLM-5:从代码到工程,国产大模型迈入Agentic Engineering时代

大模型之家讯 2月12日,智谱正式开源GLM-5,标志着国产大模型在能力边界上实现关键跃迁——从“Vibe Coding”迈向“Agentic Engineering”。这一转变不仅意味着模型能“写代码”,更意味着它能“完成工程”,具备端到端交付复杂系统的能力。

智谱开源GLM-5:从代码到工程,国产大模型迈入Agentic Engineering时代

GLM-5以744B参数规模(激活40B)和28.5T token的预训练数据,构建了更强大的通用智能基座。其引入的“Slime”异步强化学习框架,支持模型在长程交互中持续学习;同时,首次集成的DeepSeek稀疏注意力机制,在不牺牲长文本性能的前提下,显著降低部署成本,提升推理效率。这些底层技术革新,为模型在真实工程场景中的稳定表现提供了坚实支撑。

编程与智能体双SOTA:逼近Claude Opus 4.5的工程体感

智谱开源GLM-5:从代码到工程,国产大模型迈入Agentic Engineering时代
智谱开源GLM-5:从代码到工程,国产大模型迈入Agentic Engineering时代
智谱开源GLM-5:从代码到工程,国产大模型迈入Agentic Engineering时代

在编程能力上,GLM-5在SWE-bench-Verified(77.8)和Terminal Bench 2.0(56.2)等权威基准中取得开源模型最高分,性能超越Gemini 3 Pro。内部测试显示,其在前端、后端及长程任务中平均性能较GLM-4.7提升超20%,能自主完成系统重构、深度调试与多步骤规划,使用体验已逼近闭源顶尖模型Claude Opus 4.5。

智谱开源GLM-5:从代码到工程,国产大模型迈入Agentic Engineering时代

GLM-5在Agent能力上实现全面突破。在BrowseComp(联网理解)、MCP-Atlas(工具调用)和τ²-Bench(多工具复杂任务)三大评测中均位列开源第一。在模拟商业运营的Vending Bench 2中,其一年期经营账户余额达4432美元,展现出卓越的长期目标一致性与资源管理能力——这正是Agentic Engineering的核心要求。

智谱开源GLM-5:从代码到工程,国产大模型迈入Agentic Engineering时代

国产算力护航,四大场景落地Agentic能力

GLM-5的上线同步完成与华为昇腾、寒武纪、昆仑芯、海光等主流国产芯片的深度适配,通过底层算子优化,实现高吞吐、低延迟的线上推理服务,为大规模应用提供算力保障。

其能力已在四大典型场景中落地:
一是端到端应用开发,开发者已用GLM-5构建横版解谜游戏、Agent交互世界等可上线产品;
二是通用Agent助手,通过AutoGLM-OpenClaw,用户可一键部署7×24小时智能实习生,自动执行搜索、整理、编程等任务;
三是Z Code全流程编程,用户仅需描述需求,模型即自动拆解、并发执行编码、调试、预览全流程,甚至支持手机远程指挥桌面Agent;
四是办公文档直出,GLM-5可直接生成产品需求文档、财务报告、电子表格等结构化文件,无缝对接Z.ai与智谱清言平台。

目前,GLM-5已在Hugging Face与ModelScope开源,遵循MIT协议。Max用户已可使用,Pro用户将在5日内开放。随着GLM Coding Plan同步升级,包括OpenClaw官方适配、飞书机器人集成及Excel AI插件(Beta)等新功能,GLM-5正加速推动AI从“辅助工具”向“工程主体”演进。

原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/14636

(0)
上一篇 14小时前
下一篇 1小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注