大模型之家讯 今日,DeepSeek推出超级计算加速器——DeepGEMM,大幅提升AI数学运算速度。该工具基于Hopper架构GPU,实现1350+ FP8万亿次浮点运算,核心逻辑代码约300行。采用FP8和混合MoE布局,性能超越手工调优算子。在专用硬件上速度可提升3倍以上,显著加快模型训练/推理过程。
大模型之家讯 今日,DeepSeek推出超级计算加速器——DeepGEMM,大幅提升AI数学运算速度。该工具基于Hopper架构GPU,实现1350+ FP8万亿次浮点运算,核心逻辑代码约300行。采用FP8和混合MoE布局,性能超越手工调优算子。在专用硬件上速度可提升3倍以上,显著加快模型训练/推理过程。