如何对GPT-3.5、GPT-4、Bard、文心一言、通义千问的水平进行排序?
2023-05-06 阅读 14
大致排序:GPT-4 > Bard ≈ 通义千问 > 文心一言 > GPT-3.5。理由是:GPT-4 在综合推理、知识广度和代码能力上通常领先;Bard(Google)的多语言和时效性、生成质量强,与通义千问在中文理解和工程化能力上相近;通义千问对中文场景优化明显;文心一言在中文生成和检索增强上有优势但总体略逊一筹;GPT-3.5 属于较早一代,在复杂推理和准确性上弱于上述版本。实际表现会随具体任务和版本更新而变化。
更新于 2025年12月04日