扒一扒Nvidia大规模分布式训练框架Megatron-LM的坑和优化点?

2023-12-08 阅读 63
更新于 2023年12月08日