Jan, 2024

广义低秩矩阵强盗问题的高效框架

TL;DR研究了随机上下文低秩矩阵赌博问题,提出了 G-ESTT 框架和 G-ESTS 框架,分别达到了有限次后悔的上界,并进行了一系列实验来验证算法的可行性和性能。