哈尔滨工业大学(深圳)发布多模态大模型“九天”

大模型之家讯近日,哈尔滨工业大学(深圳)发布了名为九天(JiuTian-LION)的多模态大语言模型,通过融合细粒度空间感知和高层语义视觉知识,取得了在13个视觉语言任务上的state-of-the-art性能,尤其在Visual Spatial Reasoning任务上实现了5%的性能提升。
据称,视觉信息提取不足问题得到解决,九天模型通过渐进式融合细粒度空间感知视觉知识和软提示下的高层语义视觉证据,有效提升了视觉理解能力,减轻了MLLMs的幻觉现象。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注