Nov, 2023

高效广义低秩张量内容自助机

TL;DR本文提出了一种新颖的多维数据和奖励函数非线性性能充分发挥的强大 Bandits 算法,引入了广义低秩张量上下文 Bandits 模型进行决策服务,并证明其优于向量化和矩阵化情况的后悔界。通过一系列仿真和真实数据实验验证了该算法的有效性,充分利用了低秩张量结构来提升学习性能。