Jul, 2024

关于潜在扩散变压器 (DiTs) 的统计速率和可证明高效准则

TL;DR我们研究了在低维线性潜空间假设下, extbf {DiT} 的统计和计算极限。根据渐进的潜空间维度,我们推导了 extbf {DiT} 潜空间网络的逼近误差界,并给出了相应的样本复杂度界限。同时,我们表明从估计的得分函数生成的数据分布收敛于原始数据分布的某个临近区域。我们还对潜空间 extbf {DiT} 的前向推断和反向计算进行了研究,证明了在强指数时间假设下,前向推断可以在接近线性时间内实现效率提升,而通过利用 extbf {DiT} 训练中的梯度计算中的低秩结构,反向计算可以实现几乎线性时间的训练加速。在低维空间假设下,我们发现收敛速度和计算效率都受到子空间维度的支配,表明潜空间 extbf {DiT} 有潜力克服初始数据的高维挑战。