为什么transformer decoder在推理时不用mask,但GPT在推理时就需要用mask?

2024-03-13 阅读 8
更新于 2026年01月03日