DeepSeek发布6710亿参数AI模型DeepSeek-Prover-V2-671B,支持多精度与高效推理

大模型之家讯 4月30日,DeepSeek在Hugging Face开源社区发布全新AI模型DeepSeek-Prover-V2-671B,参数量达6710亿,为Prover-V1.5数学模型的升级版。该模型采用safetensors文件格式与多精度支持,显著提升训练与部署效率,基于DeepSeek-V3架构,通过MoE混合专家模式、61层Transformer层及7168维隐藏层实现复杂计算,支持最大163840长度的上下文处理,并通过FP8量化技术优化模型体积与推理速度,适用于高精度数学证明场景。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注