Mar, 2023

GPT-3 和 GPT-3.5 系列模型综合能力分析

TL;DR本研究选取了 6 个代表性的 GPT 系列模型,对它们在 21 个数据集上进行了 9 项自然语言任务的性能评估,发现尽管引入强化学习任务和人性化反馈机制提高了 GPT 系列模型生成人类语言的能力,但也有牺牲部分任务解决能力的代价,同时还有提高模型的鲁棒性的空间。