中科院国家天文台开源天文大模型 StarWhisper

大模型之家讯 10 月 23 日,据媒体报道称,中科院国家天文台的开源星语 StarWhisper 天文大模型在甲骨文 AI 研究院与 LanguageX AI Lab 联合发布的 CG-Eval 上获得了总排名第二的成绩。该模型在数学推理和天文能力方面接近或超过了 GPT3.5 Turbo。

星语 StarWhisper 是一个基于天文大模型 StarGLM 开发的开源项目,旨在提升大模型在天文通用知识和多模态任务上的能力,为未来可部署于望远镜阵列的科学具身智能——司天大脑打下基础。星语 StarWhisper 系列模型包括 6B,7B,13B,14B,20B 等规模,通过数据集清洗、监督微调、DPO 等方法,缓解了大模型在天文领域的幻觉现象,提升了数学推理、代码能力等方面的表现。

上一篇:

下一篇:

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注