GPT-6B以上的大模型相比BERT-110M,在微调数据充足的情况下,只对NLG任务有较大提升吧?

2023-06-22 阅读 40
更新于 2023年06月22日