Jul, 2023
具备鲁棒性的线性赌臂机算法的 A/B 测试与最佳臂识别
A/B Testing and Best-arm Identification for Linear Bandits with Robustness to Non-stationarity
Zhihan Xiong, Romain Camilleri, Maryam Fazel, Lalit Jain, Kevin Jamieson
TL;DR我们研究了在线线性赌臂问题中的固定预算最佳臂识别问题,并提出了一种能够在非稳态环境下稳健识别的算法。