GPT-6B以上的大模型相比BERT-110M,在数据充足的场景,有多大提升?

2023-06-22 阅读 32
更新于 2023年06月22日