Feb, 2016

BISTRO: 一种用于上下文感知推荐的高效基于松弛的方法

TL;DR通过对环境上下文信息进行考虑,使用无标签数据使得策略选择问题具有可计算性,并基于广义乘法逼近算法构建的算法解决求解难度超过多项式时间的EMR问题,同时解决了有关环境敌意、全信息监督在线学习问题的学习难点。