大模型之家讯 12 月 7 日凌晨,谷歌官方宣布发布 Gemini 1.0,这是其认为规模最大、功能最强大的人工智能模型,可以处理视频、音频和文本等不同内容形式的信息。据介绍,针对不同场景,谷歌发布了三种不同版本:Gemini Ultra,规模最大且功能最强大的模型,适用于高度复杂的任务;Gemini Pro,适用于各种任务的最佳模型;Gemini Nano,端侧设备上最高效的模型。
此外,谷歌在多种任务上评估了两种模型的性能,从自然图像、音频、视频理解到数学推理,Gemini Ultra 在 32 个常用的学术基准的 30 个上,已经超越 GPT-4。而在 MMLU(大规模多任务语言理解)测试中,Gemini Ultra 以 90.0% 的高分,成为第一个在 MMLU 上超越人类专家的模型。据称,MMLU 综合使用了数学、物理、历史、法律、医学和伦理等 57 个科目,用于测试世界知识和解决问题的能力。