Mar, 2023

关于语言理解任务,GPT-3.5 对前身模型的鲁棒性有多强?一项全面研究

TL;DR该研究全面评估了 GPT-3.5 在 21 个数据集上进行文本转换后的表现,发现其在某些任务上表现优异,但仍存在重大的鲁棒性降级,而且 GPT-3.5 面临着一些特定的鲁棒性挑战,这些发现对于了解其限制以及指导未来的研究具有重要价值。