May, 2024

具有半绑定反馈的随机在线一致预测

TL;DR通过修改模型输出一组标签而不是单个标签,符合预测已成为一种可行的不确定性量化策略。在在线学习设置中,我们考虑了半强盗反馈,其中只有在真实标签包含在预测集中时,我们才能观察到真实标签。我们提出了一种针对这种情况的新颖符合预测算法,并证明它相对于最优符合预测器具有亚线性遗憾。我们在检索任务和图像分类任务上评估了我们的算法,并且证明它在经验上获得了良好的性能。