在线低秩矩阵补全

ICLRSep, 2022

Online Low Rank Matrix Completion

Prateek Jain, Soumyabrata Pal

TL;DR本文研究在线低秩矩阵完成问题，提出了一个基于探索 - 利用策略及用户聚类技术的 OCTAL 方法，可以在多项臂赌博机问题的基础上获取 $ O ({m polylog} (M+N) T^{2/3})$ 的遗憾，并在 Rank-1 情况下得到 $O ({m polylog} (M+N) T^{1/2})$ 的近似率。

Abstract

We study the problem of {\em online} low-rank matrix completion with $\mathsf{M}$ users, $\mathsf{N}$ items and $\mathsf{T}$ rounds. In each round, the algorithm recommends one item per user, for which it gets a

online low-rank matrix completion multi-armed bandit problem regret octal

发现论文，激发创造

基于每个项目预算约束的在线协同过滤：阻塞协同强盗

设计了一个叫做 B-LATTICE（通过矩阵完成的被阻塞潜在臂选择的协作性乐透机制）的算法，通过满足预算限制并在用户之间进行协作，以最大化他们的累积奖励。在理论上，满足合理的潜在结构假设，对于具有 M 个用户，N 个臂，每个用户 T 轮和 C=O (1) 个潜在类别的问题，B-LATTICE 在预算约束为 B=O (logT) 的条件下，实现了每个用户的尽量减小后悔为 O (√(T (1+N/M)))。这是该问题的首个次线性后悔上界，当 B=T 时与极小后悔上界相匹配。实证上，我们证明了即使在 B=1 时，我们的算法也具有优越的性能。

Oct, 2023

在线策略学习与矩阵补全的推理

基于矩阵完成赌徒问题 (MCB) 和在线梯度下降算法，探索碎状历史特征的在线决策问题。研究比较不同勘探概率和步长调度下的策略学习和后悔表现，同时研究基于反向反比加权 (IPW) 的去偏方法和在线策略推理的通用框架，通过实验验证理论结果，应用于旧金山停车定价项目数据，取得了引人注目的发现和超过基准策略的表现。

Apr, 2024

随机低秩赌博机

本文提出了一种名为 LowRankElim 的算法，该算法能够在一定时间复杂度下对一个非负矩阵寻找其的最大值，并且在文献中该类结果首次出现。

Dec, 2017

在线平台中自适应学习选择 - 排序

优化用户排序列表的算法将用户偏好和物品位置的变化考虑在内，通过上界调整预测的用户满意度分数，并选择最大化这些调整分数的排序操作，以在异质用户中个性化用户体验。该算法在实验中表现优于基线模型。

Jun, 2024

在线矩阵分解推荐的交替线性赌博机算法

本文提出了一种在线矩阵分解推荐算法，结合了线性赌博和交替最小二乘法，通过累积遗憾和平均累积 NDCG 评估算法性能，实验结果表明该算法在三个综合数据集和三个真实数据集上优于两个最先进的在线算法。

Oct, 2018

基于矩阵完成的 Top-N 推荐系统

该研究提出了一种基于低秩假设的推荐算法，用非凸秩松弛而不是核范数来提供更好的秩近似和高效的优化策略，经过实验证明，该方法将 Top-N 推荐的准确性提升到了一个新的水平。

Jan, 2016

低秩广义线性赌博机问题

提出了一种基于在线到置信区间映射和基于低秩矩阵覆盖的指数加权平均预测器相结合的算法，解决了低秩线性赌博机问题，具体算法延伸自探索子空间再精炼算法，可以使得拥有低秩矩阵 Theta 的线性赌博机达到更好的期望累积损失表现并得到了实验的验证。

Jun, 2020

在线排名与 Top-1 反馈

本研究探讨了一种在线学习算法，使用新颖的 Top-1 反馈模型，评估对多样性兴趣用户的固定排名商品排名能力，并证明了其对于几种流行的排名度量具有最小化后悔的能力。

Oct, 2014

针对长尾中的用户和物品的自适应矩阵补全

本研究发现 real-world 数据集中的评分偏差会影响基于矩阵补全的协同过滤推荐系统预测准确性，且建议采用基于评分数量的算法以提高预测准确性。

Apr, 2019

用户有限注意力的利用：失配、学习和排序

使用用户的有限注意力解决推荐系统中的长期回报偏差问题，通过在线贪心算法和多项式时间算法降低后悔度和寻优问题。

Feb, 2024