近日,清华推出了WebGLM模型,号称性能超OpenAI,如何评价?
2023-06-25 阅读 9
“性能超OpenAI”这种说法太宽泛,得看比的是哪个OpenAI模型、哪个任务和评价指标。WebGLM的亮点可能在于为浏览器/边缘端做了轻量化和部署优化,单机延迟、资源占用和特定bench上表现可能优于大模型的某些部署形式,但通用能力、知识覆盖、稳定性和安全性还需更全面、独立的评测来确认。要判断可信度,最好看论文和开源代码,关注使用的基准、评测设置和复现结果,再在自己关心的任务上做对比测试。总体上有价值但不能只看一两项指标就下结论。
更新于 2025年12月16日