Apr, 2023

交互决策中的实例最优性:走向一个非渐近理论

TL;DR本研究旨在开发适应性算法,用于互动决策制定,并在实际状况好的实例中适应性地提高性能。研究提出了 Allocation-Estimation Coefficient (AEC) 的复杂度度量,并提出了新的算法 AE2,它控制了 AEC 的速率,达到非渐近实例优化性能。这些结果补充了较差保证,即现有的统计复杂度概念不足以推导非渐近保证,并且在某些技术条件下,有限时间内学习实例优化决策分配需要限定 AEC。