Yandex开源LLM训练工具 节省高达20%的GPU资源

摘要 据悉,跨国科技公司Yandex最近推出YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。YaFSDP是目前最有效的公开可用工具,用于增强G...

据悉,跨国科技公司Yandex最近推出YaFSDP,这是一种用于训练大型语言模型(LLM)的开源方法。

YaFSDP是目前最有效的公开可用工具,用于增强GPU通信并减少LLM训练中的内存使用量,与FSDP相比,其训练速度提升最高可达26%,具体取决于架构和参数数量。

通过使用YaFSDP减少LLM的训练时间可以节省高达20%的GPU资源。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。