基于噪声标签稳健学习的隐式反馈数据采样器设计

SIGIRJun, 2020

基于噪声标签稳健学习的隐式反馈数据采样器设计

Sampler Design for Implicit Feedback Data by Noisy-label Robust Learning

Wenhui Yu, Zheng Qin

TL;DR使用 Bayesian Point-wise Optimization 和 Matrix Factorization 等方法解决难以预测隐式反馈数据中用户偏好的问题，构建了一个噪声标签鲁棒的模型，从而有效提高了优化质量。

Abstract

implicit feedback data is extensively explored in recommendation as it is easy to collect and generally applicable. However, predicting users' preference on implicit feedback data is a challenging task since we c

implicit feedback data noisy label bayesian point-wise optimization matrix factorization likelihood

发现论文，激发创造

利用观察数据优化贝叶斯个性化排名的采样器设计

该研究提出了针对电子商务领域的负采样算法，使用用户的附加反馈来优化商品推荐模型，在两个真实数据集中相对于基础模型有着 37.03％和 16.40％的提升，同时采用了适合学习过程的用户定向加权策略，有针对性地调整商品排序，避免了不必要的负样本采样。

Sep, 2018

非偏向性推荐系统学习来自缺失非随机暗示反馈的信息

针对推荐系统中存在的正 - 未标记问题，本研究提出一种理想损失函数和无偏估计器，并进一步提出一个剪切估计器来通过平衡偏差和方差来改进推荐系统的性能。半合成和真实实验表明，该方法在最大化推荐物品相关性方面具有更好的性能，特别是对于在训练数据中很少出现的物品。

Sep, 2019

贝叶斯负采样用于推荐

提出了一种基于贝叶斯分类器的负采样算法（BNS），通过区分真负样本和虚假负样本，提高了负采样的质量和推荐性能。

Apr, 2022

可证明的鲁棒 DPO：将语言模型与噪声反馈对齐

通过引入在随机偏好翻转情况下进行策略优化的总体框架，我们的实验表明将 rDPO 与其他从业者提出的启发式算法相比，可以显著降低偏好标签噪音对学习策略的影响。

Mar, 2024

基于贝叶斯的个性化排名算法：从隐式反馈中学习

本文研究了使用隐式反馈（点击、购买等）的个性化推荐任务，提出了一种基于贝叶斯分析的最大后验估计通用优化准则（BPR-Opt）和基于随机梯度下降与自助抽样的通用学习算法。实验证明，该方法优于矩阵分解和自适应 k 最近邻两种先前的标准学习技术。

May, 2012

推荐系统中的去噪隐式反馈

研究探讨了去噪隐式反馈机制对于推荐系统训练的影响和重要性，提出了一种自适应去噪训练策略（ADT），通过在训练过程中适当地剪枝噪声交互以提高推荐系统的训练质量。实验结果表明，ADT 显著改善了推荐质量。

Jun, 2020

基于贝叶斯最优标记的实例相关 PU 学习

本文提出了一种基于概率差距的 PU 学习算法，该算法通过利用条件概率 P (Y=1|X) 对正样例进行有偏重采样，并将未标记数据视为噪声负样例，从而自动标记一组正负样例，这些样例的标签与贝叶斯最优分类器分配的标签相同。通过核均值匹配技术纠正其偏差。实验结果表明，该方法在生成的和现实世界的数据集上均表现良好。

Aug, 2018

去偏见的隐性反馈可解释的成对排名

本文针对 Bayesian Personalized Ranking 模型的黑箱模型、暴露偏差等两个局限进行改进，提出一种新的可解释且公平的推荐模型 Explainable Bayesian Personalized Ranking，并在三个真实世界数据集上进行了实证研究。

Jul, 2021

简化和加强隐式协同过滤负采样

本文提出一种简化负采样模型的方法，通过针对设计的内存进行高效采样，解决模型学习中的假阴性问题。在两个合成数据集和三个真实数据集上的实证结果表明，该方法在负采样方面具有鲁棒性和优越性。

Sep, 2020

基于半监督学习和优化无标签数据采样的高维贝叶斯优化

本文提出一种基于半监督学习的师生模型的贝叶斯优化方法，利用未标记数据和黑盒函数，在学习到的潜在空间中降低维度，使其可应用于高维问题，优化 unlabeled data 的采样和选择，采用黑盒参数化采样分布和经过动态拟合的极值分布，该方法在多项真实世界和合成训练中优于其他已有 BO 方法。

May, 2023