Oct, 2023

在带有不确定关系的决斗伴侣竞争中识别科普兰得胜者

TL;DR通过研究三向反馈的对决问题,我们确定了一个学习算法的样本复杂度下限,提出了POCOWISTA算法,并证明了在特定条件下偏好概率的情况下,我们可以得到一个改进的样本复杂度。