设计了一个叫做 B-LATTICE(通过矩阵完成的被阻塞潜在臂选择的协作性乐透机制)的算法,通过满足预算限制并在用户之间进行协作,以最大化他们的累积奖励。在理论上,满足合理的潜在结构假设,对于具有 M 个用户,N 个臂,每个用户 T 轮和 C=O (1) 个潜在类别的问题,B-LATTICE 在预算约束为 B=O (logT) 的条件下,实现了每个用户的尽量减小后悔为 O (√(T (1+N/M)))。这是该问题的首个次线性后悔上界,当 B=T 时与极小后悔上界相匹配。实证上,我们证明了即使在 B=1 时,我们的算法也具有优越的性能。
Oct, 2023
基于矩阵完成赌徒问题 (MCB) 和在线梯度下降算法,探索碎状历史特征的在线决策问题。研究比较不同勘探概率和步长调度下的策略学习和后悔表现,同时研究基于反向反比加权 (IPW) 的去偏方法和在线策略推理的通用框架,通过实验验证理论结果,应用于旧金山停车定价项目数据,取得了引人注目的发现和超过基准策略的表现。
Apr, 2024
本文提出了一种名为 LowRankElim 的算法,该算法能够在一定时间复杂度下对一个非负矩阵寻找其的最大值,并且在文献中该类结果首次出现。
Dec, 2017
优化用户排序列表的算法将用户偏好和物品位置的变化考虑在内,通过上界调整预测的用户满意度分数,并选择最大化这些调整分数的排序操作,以在异质用户中个性化用户体验。该算法在实验中表现优于基线模型。
Jun, 2024
本文提出了一种在线矩阵分解推荐算法,结合了线性赌博和交替最小二乘法,通过累积遗憾和平均累积 NDCG 评估算法性能,实验结果表明该算法在三个综合数据集和三个真实数据集上优于两个最先进的在线算法。
Oct, 2018
该研究提出了一种基于低秩假设的推荐算法,用非凸秩松弛而不是核范数来提供更好的秩近似和高效的优化策略,经过实验证明,该方法将 Top-N 推荐的准确性提升到了一个新的水平。
Jan, 2016
提出了一种基于在线到置信区间映射和基于低秩矩阵覆盖的指数加权平均预测器相结合的算法,解决了低秩线性赌博机问题,具体算法延伸自探索子空间再精炼算法,可以使得拥有低秩矩阵 Theta 的线性赌博机达到更好的期望累积损失表现并得到了实验的验证。
Jun, 2020
本研究探讨了一种在线学习算法,使用新颖的 Top-1 反馈模型,评估对多样性兴趣用户的固定排名商品排名能力,并证明了其对于几种流行的排名度量具有最小化后悔的能力。
Oct, 2014
本研究发现 real-world 数据集中的评分偏差会影响基于矩阵补全的协同过滤推荐系统预测准确性,且建议采用基于评分数量的算法以提高预测准确性。
Apr, 2019
使用用户的有限注意力解决推荐系统中的长期回报偏差问题,通过在线贪心算法和多项式时间算法降低后悔度和寻优问题。
Feb, 2024