首页
如何看待大模型高分低能现象?
2023-11-07 阅读 18
高分低能就是在标准化测试上得分很高,但在真实场景、鲁棒性或常识推理上表现不足。原因常包括训练与评测分布不一致、基准被过拟合、模型学会找捷径而非真正理解、缺乏外部常识与因果推理能力。应对的办法是用更贴近真实任务的评测和压力测试、增加多样化与长期记忆训练、引入不确定性估计和校准、以及在上线前做实地验证并保留人为监督。
更新于 2025年12月29日