大模型之家讯 6月11日,谷歌发布DiffusionGemma,基于文本扩散机制的开放AI模型,Apache 2.0开源。与自回归模型逐个生成token不同,扩散模型并行处理所有token,在本地低带宽环境下推理速度提升4倍。H100上达1000 tokens/s,HumanEval 89.6%,AIME 2025 23.3%。
大模型之家讯 6月11日,谷歌发布DiffusionGemma,基于文本扩散机制的开放AI模型,Apache 2.0开源。与自回归模型逐个生成token不同,扩散模型并行处理所有token,在本地低带宽环境下推理速度提升4倍。H100上达1000 tokens/s,HumanEval 89.6%,AIME 2025 23.3%。