Yandex推出YaFSDP：LLM训练新利器，速度提升高达26%并节省20%GPU资源

大模型之家讯跨国科技公司Yandex近日推出了名为YaFSDP的开源方法，用于训练大型语言模型（LLM）。据称，YaFSDP通过增强GPU通信并减少LLM训练中的内存使用量，显著提高了训练效率。与现有工具FSDP相比，YaFSDP在训练速度上最高可提升26%，具体提升幅度取决于架构和参数数量。此外，使用YaFSDP还能节省高达20%的GPU资源，为开发者在LLM训练中提供了更高效的解决方案。