Oct, 2022

衡量和缩小语言模型中的组合性差距

TL;DR探究了语言模型在对复合性推理任务中的表现,提出了评估模型的整体解决方案的组成性差异比率,并发现随着模型大小的增加,其单次跳问题回答的性能比多次跳问题更快提高,而提供良好的渐进提示可以缩小这种差距,其中 self-ask 方法最近进一步提高了精度。