Jun, 2024

带挑战反馈的主动聚类

TL;DR在本文中,我们研究了主动聚类问题(ACP)。一个学习者与具有 d 维亚高斯反馈的 N 臂随机赌博机交互。存在一致维向量的 K 个组将臂分为隐藏分区,同一组中的臂共享相同的均值向量。学习者的任务是以最小的预算发现这个隐藏分区,并且误差概率小于一个预定的常数 δ。在本文中,我们(i)推导了预算的非渐近下界,(ii)提出了计算高效的 ACB 算法,其预算与大多数情况下的下界相匹配。我们改进了统一采样策略的性能。重要的是,与批处理设置不同,我们证明主动设置中不存在计算信息差距。