为什么transformer decoder在推理时不用mask，但GPT在推理时就需要用mask？-有趣的事

为什么transformer decoder在推理时不用mask，但GPT在推理时就需要用mask？

2024-03-13 阅读 16

更新于 2026年01月03日