Nov, 2021

线性上下文强化学习模型选择的通用自适应算法

TL;DR在上下文强化学习中进行模型选择是一项重要的补充问题。本研究提出了一些新的算法,这些算法可以在数据自适应的情况下进行探索,并提供模型选择保证。