May, 2017

多任务学习用于情境赌博机

TL;DR本文提出了一个基于上限置信区间的多任务学习算法框架,用于处理具有高任务相似性的上下文型臂带问题,并揭示了此算法在数据中高任务相似性的优势。