带人工反馈的强化学习（rlhf）和微调（fine-tune）有什么区别？-有趣的事

带人工反馈的强化学习（rlhf）和微调（fine-tune）有什么区别？

2024-02-17 阅读 12

更新于 2024年11月19日