商汤发布日日新5.0大模型

大模型之家讯 今日,商汤科技发布日日新5.0大模型,采用MOE混合专家架构,基于超过10TB tokens训练,推理上下文窗口200K,全面对标GPT-4 Turbo。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注