大模型之家讯 近日,Meta AI 宣布,推出一款名为 Belebele 的多语言阅读理解数据集,可以直接比较模型对不同语言的理解程度。
Belebele 其中涵盖了 122 种语言,可以评估高、中、低资源语言的单语言和多语言模型。该数据集由基于 FLORES-200 段落的精心设计的多项选择题和答案组成,能够以高资源和低资源语言评估 NLP 系统和大型语言模型。由于 Belebele 是完全并行的,因此可以直接比较所有语言的模型性能。
大模型之家讯 近日,Meta AI 宣布,推出一款名为 Belebele 的多语言阅读理解数据集,可以直接比较模型对不同语言的理解程度。
Belebele 其中涵盖了 122 种语言,可以评估高、中、低资源语言的单语言和多语言模型。该数据集由基于 FLORES-200 段落的精心设计的多项选择题和答案组成,能够以高资源和低资源语言评估 NLP 系统和大型语言模型。由于 Belebele 是完全并行的,因此可以直接比较所有语言的模型性能。