Oct, 2023

针对随机情境对决赌徒的方差感知后悔界限

TL;DR本研究提出了一种基于广义线性模型的上下文对决算法,该算法在计算效率和方差感知遗憾边界方面有优势,并通过实验验证了其优于以往无方差算法的优点。