DeepSeek发布6710亿参数AI模型DeepSeek-Prover-V2-671B，支持多精度与高效推理

大模型之家讯 4月30日，DeepSeek在Hugging Face开源社区发布全新AI模型DeepSeek-Prover-V2-671B，参数量达6710亿，为Prover-V1.5数学模型的升级版。该模型采用safetensors文件格式与多精度支持，显著提升训练与部署效率，基于DeepSeek-V3架构，通过MoE混合专家模式、61层Transformer层及7168维隐藏层实现复杂计算，支持最大163840长度的上下文处理，并通过FP8量化技术优化模型体积与推理速度，适用于高精度数学证明场景。

DeepSeek发布6710亿参数AI模型DeepSeek-Prover-V2-671B，支持多精度与高效推理

发表回复