Apr, 2017

线性赌博机误设

TL;DR本研究考虑了线性多臂老虎机问题中的在线学习问题,并提出了一种新的算法,该算法包括一个线性假设检验和OFUL或UCB算法的决策。该算法在完全线性情况下表现出OFUL的良好遗憾性能,在存在不稀疏偏差性质的错误规范模型上避免了线性遗憾现象,并且在综合数据实验中得到了一致的支持。