Jun, 2021

通过离线神谕在具有多个类别的情境下选择最优模型的方法

TL;DR本研究提出了一种新的算法,用于解决上下文 Bandit 问题中的模型选择问题,该算法通过离线模型选择预言机的方式平衡偏差 - 方差交换和探索 - 利用交换,并具有与回归模型选择相同的计算要求。