Aug, 2023

多分类问题下的在线可学习性研究

TL;DR我们研究基于强化学习反馈的在线多类别分类。我们扩展了(daniely2013price)的结果,通过展示在标签空间无限的情况下,强化学习小石维度的有限性是在线多类别可学习性的必要和充分条件。我们的结果补充了(hanneke2023multiclass)的最近工作,他们证明了在标签空间无限的情况下小石维度描述了全信息设置中的在线多类别可学习性。