用AI生成的数据训练AI,会不会导致GPT智商下降?
2023-07-25 阅读 103
不会必然让“智商下降”,但确实有风险。问题主要在于数据质量和分布:如果用大量未经筛选的AI生成内容训练,会把已有的错误、偏差和套路放大,形成自我强化的循环,导致事实性、创造性和多样性下降;模型也可能过拟合到生成器的风格而丧失对真实世界的判别力。防范的方法是把合成数据和高质量人工标注混合使用、对生成样本做严格过滤和去噪、保持数据多样性并做人工抽样验证,必要时用外部知识源或人类反馈校正。总之,合理采集、筛选和混合使用AI生成的数据可以带来好处,放任低质量合成数据则可能让模型表现退步。
更新于 2025年12月22日