大模型之家讯 9月12日,阿里巴巴通义千问公布了下一代基础模型架构 Qwen3‑Next,并对该架构下的 Qwen3‑Next‑80B‑A3B 系列模型进行开源。与前代 Qwen3 的多任务扩展(MoE)设计相比,Qwen3‑Next 在核心技术上实现多项升级:引入混合注意力机制提升模型表达力;采用高稀疏度 MoE 结构实现更高参数利用率;加入多种训练稳定化优化手段降低训练不稳定风险;同时利用多 token 预测机制显著提升推理效率。该系列模型已可在 Hugging Face、魔搭社区等平台获取。