大模型之家讯 6月16日,美团LongCat团队发布并开源LongCat-Flash-Thinking-2601模型。该模型在智能体工具调用能力上登顶开源SOTA,AIME-25评测获满分100分,τ²-Bench工具调用88.2分,BrowseComp任务73.1分为全模型最优。作为全球首个完整开源且支持在线免费体验’重思考模式’的模型,可并行启动8个推理单元保障决策可靠性。
大模型之家讯 6月16日,美团LongCat团队发布并开源LongCat-Flash-Thinking-2601模型。该模型在智能体工具调用能力上登顶开源SOTA,AIME-25评测获满分100分,τ²-Bench工具调用88.2分,BrowseComp任务73.1分为全模型最优。作为全球首个完整开源且支持在线免费体验’重思考模式’的模型,可并行启动8个推理单元保障决策可靠性。