DeepSeek开源DeepGEMM超级计算,大幅提速AI数学运算

大模型之家讯 今日,DeepSeek推出超级计算加速器——DeepGEMM,大幅提升AI数学运算速度。该工具基于Hopper架构GPU,实现1350+ FP8万亿次浮点运算,核心逻辑代码约300行。采用FP8和混合MoE布局,性能超越手工调优算子。在专用硬件上速度可提升3倍以上,显著加快模型训练/推理过程。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注