Oct, 2023

线性VAE中的学习动力学:后验崩塌临界点、多余潜变空间陷阱和KL退火加速

TL;DR在这项研究中,对变分自编码器(VAEs)中的后验折叠问题进行了理论分析,发现学习动态会在输入维度趋近无限大时收敛为确定性过程。此外,研究还表明VAE最初学习到纠缠表示,并逐渐获得解耦表示。当超参数β超过某一阈值时,无论学习周期如何,后验折叠都是不可避免的。背景噪声引发了超量潜在变量,导致过拟合,损害了泛化和学习收敛性。研究还发现适当调整的KL渐近算法能加速收敛。