豆包大模型团队开源UI-TARS-1.5:多模态智能体展示卓越性能

大模型之家讯 4月17日,豆包大模型团队推出并开源了基于视觉-语言模型构建的多模态智能体UI-TARS-1.5。该智能体在7个GUI图形用户界面评测基准中取得领先表现,并首次展示了其在游戏中的长时推理能力和开放空间中的交互能力。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注