谷歌团队提出用AI反馈强化学习 (RLAIF) ,替代人类进行偏好标注,这会对AI研究产生什么影响?

2023-09-06 阅读 46
更新于 2023年09月06日