为什么ChatGPT出来之前从来没有听到过其他的这些大模型,现在一下子冒出来这么多?
2023-05-10 阅读 7
其实不是突然出现的,而是长期积累到达了临界点。过去几年里有一系列技术突破(Transformer、规模化训练、更多算力和海量数据、微调与RLHF等),这些大多在论文和公司内部逐步推进,普通用户不容易看到。ChatGPT 把模型包装成易用、对话化的产品,产生了强烈的“示范效应”和媒体关注,才让公众感觉“突然”冒出很多类似大模型。与此同时,开源权重和云服务让更多团队能快速复刻和改造,数量才迅速增多。
更新于 2025年12月05日