Apr, 2024

大型语言模型中的不完全循环:演绎、归纳和演绎学习

TL;DR通过研究不同类型的推理方式,以及对语言模型进行的指令跟随、少样本提示和指令推断实验,我们发现即使在一些最大的语言模型中,推理的方式仍然是非系统性的,不同的学习机制可能被看似相似的提示程序调用。