大模型之家讯 昆仑万维发布消息称,在权威推理榜单 Benchmark GSM8K 测试中,昆仑万维自研的通用基座大模型天工大模型以 80% 的正确率脱颖而出,大幅领先 GPT-3.5(57.1%)和 LLaMA2-70 B(56.8%),“标志着天工大模型的推理能力达到全球领先,接近 GPT-4”。
大模型之家讯 昆仑万维发布消息称,在权威推理榜单 Benchmark GSM8K 测试中,昆仑万维自研的通用基座大模型天工大模型以 80% 的正确率脱颖而出,大幅领先 GPT-3.5(57.1%)和 LLaMA2-70 B(56.8%),“标志着天工大模型的推理能力达到全球领先,接近 GPT-4”。