百度智能云全面升级百舸AI计算平台 实现多芯混合训练效能提升

摘要 据悉,百度智能云在2024百度云智大会上宣布将其百舸AI异构计算平台全面升级至4.0版本。该升级主要针对解决算力资源短缺问题,重点提高了“...

据悉,百度智能云在2024百度云智大会上宣布将其百舸AI异构计算平台全面升级至4.0版本。该升级主要针对解决算力资源短缺问题,重点提高了“多芯混训”能力,在万卡规模集群上实现了95%的多芯混合训练效率。此外,在集群部署环节也进行了改进,新版百舸可以通过工具层面实现秒级部署,并将万卡集群运行准备时间从数周最快缩短到1小时。另外,在故障检测和自动容错机制方面也有所提高,新版百舸在万卡集群上达到超过99.5%的有效训练时长。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。