大模型推理prefill阶段和decode阶段的batchsize各自应该如何计算?

2025-01-02 阅读 12
更新于 2025年01月02日