大模型之家讯 10月19日,昆仑万维在互动平台表示,天工 AI 助手的手机 App 已开启内测。日前,昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型测评中,综合得分排名第一;在权威推理榜单 Benchmark GSM8 K 测试中,天工大模型以 80% 的正确率,领先 GPT-3.5(57.1%)和 LLaMA2-70 B(56.8%),推理能力达到全球领先水平。
此外,在基于 SuperCLUE 综合性测评基准,包括多轮开放式问题测评 SuperCLUE-OPEN 和三大能力客观题测评 SuperCLUE-OPT 的测试中,天工大模型文理兼顾,跻身中文闭源模型第一梯队。