大模型之家讯 4月30日,DeepSeek在Hugging Face开源社区发布全新AI模型DeepSeek-Prover-V2-671B,参数量达6710亿,为Prover-V1.5数学模型的升级版。该模型采用safetensors文件格式与多精度支持,显著提升训练与部署效率,基于DeepSeek-V3架构,通过MoE混合专家模式、61层Transformer层及7168维隐藏层实现复杂计算,支持最大163840长度的上下文处理,并通过FP8量化技术优化模型体积与推理速度,适用于高精度数学证明场景。