Apr, 2025

模仿学习的泛化能力

TL;DR本研究针对模仿学习在有限数据集上训练的策略难以超越训练分布的问题,提出了一种统一的泛化能力视角。通过信息论和数据分布特性,本研究揭示了泛化差距的上界,并提供了有效训练策略设计的理论指导,强调输入数据多样性和同一输入下输出标签变异性的结合,对于提升模仿学习的泛化能力具有重要影响。