Apr, 2023
交互决策中的实例最优性:走向一个非渐近理论
Instance-Optimality in Interactive Decision Making: Toward a
Non-Asymptotic Theory
TL;DR本研究旨在开发适应性算法,用于互动决策制定,并在实际状况好的实例中适应性地提高性能。研究提出了Allocation-Estimation Coefficient (AEC)的复杂度度量,并提出了新的算法AE2,它控制了AEC的速率,达到非渐近实例优化性能。这些结果补充了较差保证,即现有的统计复杂度概念不足以推导非渐近保证,并且在某些技术条件下,有限时间内学习实例优化决策分配需要限定AEC。