云知声发布原生智能体大模型U2,多项评测进入第一梯队

云知声发布原生智能体大模型U2,多项评测进入第一梯队

大模型之家讯 6月8日,云知声发布新一代通用大语言模型U2,定位为原生智能体大模型。核心主张是“高智能密度×高Token价值”,用更少激活资源承载更强能力,让每次调用更接近交付结果。

U2在多项权威评测中进入主流第一梯队。GPQA Diamond得分87.9,超过GLM-5.1和DeepSeek-V4-Flash;SWE-Bench Verified得分75;Agent端到端执行能力Claw-Eval得分76.9;办公交付评测GDPval得分72.9。这表明U2在推理、代码、Agent和办公交付上形成了系统性表现。

云知声发布原生智能体大模型U2,多项评测进入第一梯队

技术层面,U2的核心创新是混合思考机制和Agent-Harness协同训练。混合思考机制根据任务复杂度动态切换思考形态——早期在隐空间高效探索路径,关键判断阶段转为显式推理。Agent-Harness将模型能力提升与执行框架纳入同一训练闭环,让真实执行轨迹反过来强化模型。

U2重点强化了Reasoning、Coding和Agent三大方向。Coding面向端到端工程交付,Agent侧重多工具协同与长流程编排,三者构成“理解规划—执行协作—校验交付”的任务闭环。目前U2已上线云知声Token Hub,面向个人、开发者及组织开放。

原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/15991

(0)
上一篇 2天前
下一篇 17分钟前

相关推荐

发表回复

登录后才能评论