ICLRJun, 2020

超模型用于探索

TL;DR研究使用超模型来表示认知不确定性并指导探索,通过神经网络模型的线性超模型得出,可以更加准确地近似 Thompson 采样,并使用更复杂的探索策略。