首页
GPT等大模型为什么左右不分?
2023-08-25 阅读 16
因为这类模型主要靠大量文本学习词语之间的统计关联,语言里“左”“右”往往依赖说话者视角或上下文,且文本本身并不提供稳固的物理参照。模型内部只有符号和位置编码,缺乏真实世界的感知、身体坐标或动作反馈,无法像人那样用视角、镜像或触觉去固定左右方向,所以在需要绝对方向或上下文不明确时容易混淆。要解决就得引入视觉-运动等多模态信息或明确的参照标注。
更新于 2025年12月25日