大模型之家讯 今日,小米公司今日正式发布并开源了新一代基础语言模型MiMo-V2-Flash,该模型以极致推理效率为核心特点,在多项性能测试中跻身全球开源模型第一梯队。

据了解,MiMo-V2-Flash采用混合专家架构,总参数量达3090亿,但每次推理仅激活150亿参数,实现了高性能与高效率的平衡。该模型在代码生成能力上已超越所有开源模型,与顶级闭源模型Claude 4.5 Sonnet表现相当,而推理成本仅为后者的2.5%,生成速度提升至2倍。

在官方公布的基准测试结果中,MiMo-V2-Flash表现出色。在SWE-Bench Verified测试中取得73.4%的得分,在多语言编程基准测试SWE-Bench Multilingual中更是达到71.7%,创下开源模型新纪录。
综合基准测试表现显示,该模型整体性能已与当前顶尖开源模型DeepSeek-V3.2持平,但在推理延迟方面显著更低。
MiMo-V2-Flash的性能优势源于其创新的模型架构设计。该模型采用混合注意力机制,以5:1的比例结合滑动窗口注意力与全局注意力。
滑动窗口注意力仅关注当前token附近的128个token,计算复杂度与序列长度呈线性关系,从而大幅提高了长文本处理效率。
更具突破性的是多Token预测技术的应用。传统模型一次只能生成一个token,而MTP允许模型并行预测多个token,实现2.0-2.6倍的解码加速。
在后训练阶段,小米引入了多教师在策略蒸馏(MOPD)范式。
模型同步上线了在线体验平台Xiaomi MiMO Studio,用户无需本地部署即可体验模型功能,平台支持深度搜索与联网搜索。
AI行业研究员表示,MiMo-V2-Flash的发布标志着大模型竞争进入新阶段。“下一阶段竞争的核心不再是‘谁参数更大’,而是‘谁更适合Agent、谁跑得更快’”。(
原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/13980