Jun, 2022

最佳模型选择

TL;DR本文研究带有嵌套策略类别的赌场情境中的模型选择问题,旨在获得同时具备敌对和随机(“双赢”)的高概率遗憾保证。我们的方法要求每个基本学习器都带有可能或不可能持续的候选遗憾边界,同时,我们的元算法根据保持基本学习器的候选遗憾边界平衡的时间表播放每个基本学习器,直到它们被发现违反了保证。我们开发了谨慎的误规范测试,专门设计用于混合上述模型选择标准和利用环境(可能是良性)性质的能力。我们恢复了 CORRAL 算法在敌对环境下的模型选择保证,但在嵌套敌对线性赌徒的情况下,具有实现高概率遗憾边界的额外优势。更重要的是,我们的模型选择结果同时在间隙假设下在随机环境中保持。这些是第一个在(线性)赌徒情况下,在进行模型选择的情况下实现双赢(随机和敌对)保证的理论结果。