Oct, 2022

挑战 BIG-Bench 任务及连贯思维是否能解决它们

TL;DR评估语言模型的任务套件 BIG-Bench 在多步推理方面的表现,通过应用 “chain-of-thought” 提示,可以提高模型性能,证明多数任务要求此类提示以获得更好的性能,并且此提示与模型规模具有交互作用。