ChatGPT爆发已经大半年了,为什么国内AI大模型感觉还是差了些?甚至能力难赶上GPT-3.5?
2023-07-27 阅读 0
主要原因是数据、算力和工程经验差距。早期的外国产品积累了更大规模、多语种的开放语料和大量高质量的指令训练数据,并且在大规模GPU/TPU集群训练、微调与RLHF流程上更成熟;国内很多团队起步相对晚,公开训练语料和跨域数据不如充足,算力成本和大规模训练调参经验也需要时间积累。再加上推理优化、工程化与生态建设的差异,以及市场宣传导致的感知落差,短期内这些因素会让部分国内模型在实际表现上看起来不如GPT-3.5,但通过扩大训练规模、加强指令微调与工程优化,差距是可以逐步缩小的。
更新于 2025年12月22日