1小时只赚7块钱,非洲“AI民工”是如何训练ChatGPT的?
2023-06-25 阅读 12
“AI民工”指的是那些为训练聊天模型做标注、评审、生成示例和安全测试的人工参与者。大致流程是先收集对话/文本/音频,人工编写或润色高质量示例,再对模型不同输出按质量打分或排序,生成偏好数据;这些偏好训练出奖励模型,最后通过人类反馈强化学习(RLHF)把模型微调到更符合人类期望。还有转录、翻译、内容审核和“红队”攻击测试等任务。此类工作多通过外包或众包平台按单计费、竞争激烈,加上不同地区生活成本和支付标准,往往导致时薪很低;平台通常会用任务说明、金标准示例和复核来维持标注质量。
更新于 2025年12月16日