在十几B或者几十B的模型训练时,一般一个step的时间是多久,对应的batch_size大小是多少?

2024-12-04 阅读 12
更新于 2024年12月07日