美团LongCat-Flash-Thinking-2601开源,工具调用能力登顶SOTA

大模型之家讯 6月16日,美团LongCat团队发布并开源LongCat-Flash-Thinking-2601模型。该模型在智能体工具调用能力上登顶开源SOTA,AIME-25评测获满分100分,τ²-Bench工具调用88.2分,BrowseComp任务73.1分为全模型最优。作为全球首个完整开源且支持在线免费体验’重思考模式’的模型,可并行启动8个推理单元保障决策可靠性。

上一篇:

发表回复

登录后才能评论