MiniMax开源MiniMax-01全新系列模型,性能比肩GPT-4o

大模型之家讯 1月15日,MiniMax宣布开源其全新系列模型MiniMax-01,该系列包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。MiniMax-01系列在架构上进行了大胆创新,首次大规模实现线性注意力机制,打破了传统Transformer架构的局限。
其参数量高达4560亿,单次激活459亿,综合性能与海外顶尖模型相当,且能高效处理长达400万token的上下文,这一长度是GPT-40的32倍、Claude-3.5-Sonnet的20倍。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注