May, 2023

CoT 集合:通过思维链微调改善语言模型的零样本和少样本学习

TL;DR通过不同程度的 fine-tuning,基于 Flan-T5 的大型语言模型学习了 Chain-of-Thought 推理并表现出更强的 few-shot learning 能力,使得在 27 个数据集上的平均零 - shot 准确率提高了 4.34%和 2.44%,并在 4 个特定领域的任务上获得了进一步的改进。