大模型之家讯 6月27日,DeepSeek联合北京大学正式开源DSpark推理加速框架,针对大模型高并发推理瓶颈提出解决方案。该框架通过半自回归候选生成与置信度调度验证两项创新,在保证生成质量的前提下,将单用户生成速度提升60%至85%。DSpark已部署于DeepSeek-V4-Flash与V4-Pro预览版服务,相关代码已在GitHub DeepSpec项目开源。
大模型之家讯 6月27日,DeepSeek联合北京大学正式开源DSpark推理加速框架,针对大模型高并发推理瓶颈提出解决方案。该框架通过半自回归候选生成与置信度调度验证两项创新,在保证生成质量的前提下,将单用户生成速度提升60%至85%。DSpark已部署于DeepSeek-V4-Flash与V4-Pro预览版服务,相关代码已在GitHub DeepSpec项目开源。