大模型之家讯 2月26日,微软开源了其新型多模态AI Agent基础模型——Magma。该模型具备处理图像、视频、文本等数据的多模态能力,适用于自动下单、查询天气等功能,并能操控实体机器人和提供棋类游戏中的智能辅助。此外,Magma还引入心理预测功能,增强了时空动态理解,能准确推测视频中人物或物体的意图和行为。
大模型之家讯 2月26日,微软开源了其新型多模态AI Agent基础模型——Magma。该模型具备处理图像、视频、文本等数据的多模态能力,适用于自动下单、查询天气等功能,并能操控实体机器人和提供棋类游戏中的智能辅助。此外,Magma还引入心理预测功能,增强了时空动态理解,能准确推测视频中人物或物体的意图和行为。