Jul, 2023

不变风险最小化的无分布优化性

TL;DR深度神经网络存在与训练数据中嵌入的虚假相关性,无法泛化到不同分布的未见域,M. Arjovsky 等人引入了域外风险的概念,并将由虚假相关性引起的问题形式化为域外风险的最小化问题。本文旨在为不变风险最小化提供理论上的验证,证明了双层优化问题的解在一定条件下能使域外风险最小化。同时,文章还提供了训练数据分布和特征空间维度的充分条件,使双层优化问题能最小化域外风险。