Feb, 2009

在线硬约束多任务学习

TL;DR本文探讨了多任务在线学习,当决策者需要同时处理 M 个任务时。M 个任务是相关的,我们给出了此类问题的一个一般可行解,并提供了计算上有效的方法来选择行动,本质上是将其化简为在线最短路径问题。我们还讨论了问题的 “跟踪” 和 “劫掠” 版本,并扩展了模型,包括非可加全局损失和无穷集合的任务。