Aug, 2022

深度学习与系统性泛化之间的内在冲突

TL;DR本研究认为,内部功能共享是弱化深度学习分类任务中系统概括或系统性泛化能力的原因之一。在等效预测下,模型将输入空间划分为由边界分隔的多个部分。功能共享倾向于重复使用边界,导致新输出的部分较少,这与系统性泛化相冲突。我们在标准的深度学习模型中展现了这种现象,例如全连接、卷积、残差网络,LSTMs 和(视觉)变换器。我们希望这项研究为系统性泛化提供新的见解,并为新的研究方向奠定基础。