Oct, 2023

基于每个项目预算约束的在线协同过滤:阻塞协同强盗

TL;DR设计了一个叫做 B-LATTICE(通过矩阵完成的被阻塞潜在臂选择的协作性乐透机制)的算法,通过满足预算限制并在用户之间进行协作,以最大化他们的累积奖励。在理论上,满足合理的潜在结构假设,对于具有 M 个用户,N 个臂,每个用户 T 轮和 C=O (1) 个潜在类别的问题,B-LATTICE 在预算约束为 B=O (logT) 的条件下,实现了每个用户的尽量减小后悔为 O (√(T (1+N/M)))。这是该问题的首个次线性后悔上界,当 B=T 时与极小后悔上界相匹配。实证上,我们证明了即使在 B=1 时,我们的算法也具有优越的性能。