用强化学习将 GPTRec 与超出精确性目标对齐

MMMar, 2024

用强化学习将 GPTRec 与超出精确性目标对齐

Aligning GPTRec with Beyond-Accuracy Goals with Reinforcement Learning

Aleksandr Petrov, Craig Macdonald

TL;DRTransformer 模型在推荐系统的顺序推荐任务中应用广泛，BERT4Rec、SASRec 等模型通过使用 Top-K 策略，在准确度等度量指标上取得了最先进的性能。然而，GPTRec 作为替代 Top-K 模型的一个新方法，可以考虑复杂的物品间相互依赖关系，从而适应更多样化的度量指标。本研究提出了一个二阶段的训练方法，通过强化学习来对 GPTRec 进行训练，从而解决了推荐系统训练数据与度量指标之间的不匹配问题。在两个数据集上的实验证明，GPTRec 的 Next-K 生成方法在准确度和次要度量指标之间可以达到更好的权衡。

Abstract

Adaptations of transformer models, such as BERT4Rec and SASRec, achieve state-of-the-art performance in the sequential recommendation task according to accuracy-based metrics, such as NDCG. These models treat ite

transformer models sequential recommendation top-k strategy beyond-accuracy metrics gptrec

发现论文，激发创造

GPT4Rec: 面向个性化推荐和用户兴趣解析的生成式框架

本文介绍了 GPT4Rec，一种基于生成模型和搜索引擎的新型灵活推荐系统，它通过多查询生成技术和基于 BM25 的搜索引擎来更好地捕获用户兴趣，提高推荐的相关性和多样性。

Apr, 2023

将废料转化为黄金亏损：BERT4Rec 真的比 SASRec 更好吗？

我们的研究表明，如果采用和 BERT4Rec 相同的损失函数来训练两个模型，SASRec 在质量和训练速度方面都明显优于 BERT4Rec。此外，我们还展示了使用负采样可以有效地训练 SASRec，并且仍然优于 BERT4Rec，但负样本的数量应该远大于一个。

Sep, 2023

gSASRec：用负采样训练的序列推荐系统中减少过度自信的方法

本文研究了推荐模型中的目录规模、负采样、过度自信等问题，并提出了 gBCE 损失函数和 gSASRec 模型，通过实验证明 gSASRec 在大规模数据集中表现优异，与 BERT4Rec 相比能够在更短的训练时间内获得更好的推荐效果。

Aug, 2023

利用时间衰减选择的顺序推荐的高效有效训练

本篇研究提出了一种基于最新性采样的序列推荐算法的训练方法，该方法尝试解决目前流行的序列推荐算法训练时间过长、无法充分利用数据的问题，并测试了多种现有的模型架构，结果表明该方法不仅能够有效地提高模型性能，而且训练时间大大减少。

Jul, 2022

GPT4Rec: 图形提示调整的流媒体推荐

GPT4Rec 是一种用于流式推荐的图形提示调整方法，通过将图形模式解开为多个视图，并利用轻量级图形提示来引导模型适应用户 - 项目图中不同的交互模式，以综合理解图形并有效集成用户 - 项目交互的所有重要方面。

Jun, 2024

双向 Transformer 再排名用于语法错误纠正

通过采用 BERT 风格的自注意机制，我们提出了一种双向 Transformer 选手 (BTR)，可以找出由预训练 seq2seq 模型产生的候选句子中概率偏差的问题。与 T5-base 相比，BTR 在 CoNLL-14 和 BEA 测试集上可分别产生 65.47 和 71.27 F0.5 分数，在 JFLEG 语料库上可产生 59.52 GLEU 分数，优于 T5-base。

May, 2023

Re2G: 检索、排序、生成

Re2G 利用神经检索和排名策略结合 BART 序列生成器，在零 - shot 填槽、问答、事实核查和对话等任务中取得了相对增益为 9% 至 34% 的较大提升，是目前 KILT 排行榜上最先进的模型。

Jul, 2022

基于排名的生成模型在 [CLS] 任务中的应用

本研究旨在重新审视信息检索的生成式框架，并比较其与基于语义相似性的判别式模型在答案选择任务上的表现。同时，还展示了非似然损失对信息检索的有效性。

Oct, 2020

BERT4Rec 序列推荐的系统性综述和可重复性研究

通过分析 BERT4Rec 在不同实现情况下的表现，本文得出结论：BERT4Rec 在足够长时间的训练后，的确展现出顺序推荐的最新效果，但不同研究中对其效果的确认并不一致。我们提出了自己的 BERT4Rec 实现，并证明它可以在比原论文更短的时间内收敛至相同的表现，此外，我们还展示了该模型可以受益于采用其他的 Transformer 架构。

Jul, 2022

BERT4Rec: 使用 Transformer 的双向编码器表示进行序列推荐

利用双向编码表示从历史行为中建模用户的动态演变偏好对于推荐系统至关重要，我们通过使用 Cloze 任务对历史序列项进行联合编码来解决这个问题，并在四个基准数据集上展开广泛实验，结果显示我们的模型在各种顺序模型中表现出色。

Apr, 2019