大模型之家讯 MiniMax近日发布并开源了新一代01系列模型,包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型通过大规模应用线性注意力机制,打破了Transformer传统架构的记忆瓶颈,能够处理高达400万token的输入。这一输入长度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍,展现了其强大的处理能力。
大模型之家讯 MiniMax近日发布并开源了新一代01系列模型,包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型通过大规模应用线性注意力机制,打破了Transformer传统架构的记忆瓶颈,能够处理高达400万token的输入。这一输入长度是GPT-4o的32倍,Claude-3.5-Sonnet的20倍,展现了其强大的处理能力。