May, 2023

信仰与命运:变形金刚在组合性上的局限性

TL;DR本研究旨在探讨 Transformer 大型语言模型在复合任务上的局限性,研究结果表明 Transformer 模型虽然具有出色的多步推理性能,但其解决复合任务的方式是将多步推理化简为线性子图匹配,而并未完全发展出解决问题的系统性解决问题的方法,同时,随着任务复杂度的增加,Transformer 模型的性能也会快速下降。