Sep, 2024

最小遗憾的最佳臂识别

TL;DR本研究针对需要负责任实验的实际应用,提出了一种具有最小遗憾的最佳臂识别问题。这一创新变体有效地结合了遗憾最小化和最佳臂识别两个目标。研究表明,双重KL-UCB算法在置信水平趋近零时实现了渐近最优,揭示了遗憾最小化与最佳臂识别之间的内在联系。