Feb, 2024

真相在哪里?在持续不断的世界中被混淆的风险

TL;DR在一个连续学习的环境中,如果数据集很容易通过虚假相关性解决而不能推广到新的数据,则该数据集是混淆的。我们将展示在连续学习中,当混淆因素可能随时间变化而跨越任务时,其带来的挑战远远超过通常考虑的标准遗忘问题。尤其地,我们数学上推导了这些混淆因素对一组混淆任务的有效联合解的影响。有趣的是,我们的理论预测,在许多此类连续数据集上,当任务共同训练时虚假相关性很容易被忽略,但是当任务被顺序考虑时,避免混淆要难得多。我们构建了这样一个数据集,并通过实验证明标准的连续学习方法难以忽略混淆,而同时训练所有任务则是成功的。我们的连续混淆数据集 ConCon 基于 CLEVR 图像,展示了在处理混淆时连续学习方法需要更健壮的行为。