OpenAI 测试 GPT 内容审核功能,减少人工参与,目前该功能测试结果如何?
2023-08-16 阅读 11
截至2024年中公开的信息,OpenAI 在把自动化审核当作“初筛/分流”工具方面取得了明显进展:对明确违规(如露骨色情、明显仇恨言论、已知违法内容)判断准确率较高,能显著减少人工量。但在语境依赖、讽刺、隐含偏见、多语言/文化差异等复杂情形下误判仍不少,因此通常采用自动+人工复核的混合流程,尚未完全替代人工判断。具体性能指标会随模型和策略更新而变化。
更新于 2025年12月24日