Meta AI 推出多语言阅读理解数据集 Belebele

大模型之家讯 近日,Meta AI 宣布,推出一款名为 Belebele 的多语言阅读理解数据集,可以直接比较模型对不同语言的理解程度。

Belebele 其中涵盖了 122 种语言,可以评估高、中、低资源语言的单语言和多语言模型。该数据集由基于 FLORES-200 段落的精心设计的多项选择题和答案组成,能够以高资源和低资源语言评估 NLP 系统和大型语言模型。由于 Belebele 是完全并行的,因此可以直接比较所有语言的模型性能。

上一篇:

下一篇:

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注