Jan, 2024

深度学习模型的双尺度复杂度度量

TL;DR我们引入了一种基于有效维度的统计模型的新容量度量 2sED。这个新数量在模型的温和假设下能证明地限制了泛化误差。此外,对标准数据集和流行的模型架构的模拟结果表明,2sED 与训练误差具有良好的相关性。对于马尔可夫模型,我们展示了如何通过分层迭代方法从下方高效地逼近 2sED,这使我们能够处理具有大量参数的深度学习模型。模拟结果表明,这种逼近适用于不同的突出模型和数据集。