May, 2024

语言建模的思维标记

TL;DR当语言模型遇到复杂的计算问题时,由于其不能执行复杂的推理,它们通常会出现错误。为了增强语言模型的泛化能力,并与人类行为相对应,我们提出使用特殊的 “思考标记”,使模型在遇到复杂问题时能够执行更多计算。