Oct, 2023

通过遗憾-置信区间转化改进(多项式)逻辑回归赌博机的遗憾界限

TL;DR通过一种新的方法称为遗憾与置信集转化(R2CS),我们在逻辑回归赌博机中获得了对S的严格遗憾界限的改进,同时保持了计算可行性和对其他因素(如d和T)的依赖。通过引入新的鞅集中步骤来将其应用于多项式逻辑回归赌博机,我们也获得了类似的遗憾改进,展示了R2CS的有效性。