通过对抗示例评估会话推荐系统的鲁棒性

Mar, 2023

通过对抗示例评估会话推荐系统的鲁棒性

Evaluating the Robustness of Conversational Recommender Systems by Adversarial Examples

Ali Montazeralghaem, James Allan

TL;DR本文介绍了一个对话推荐系统（CRSs）的鲁棒性评估方案，其中自动生成敌对样本以评估系统在不同输入数据面前的鲁棒性。通过执行这些敌对样本，我们可以比较不同 CRSs 满足用户偏好的能力，并表明测试的三个 CRSs 都不够稳健和可靠。

Abstract

conversational recommender systems (CRSs) are improving rapidly, according to the standard recommendation accuracy metrics. However, it is essential to make sure that these systems are robust in interacting with users including regular and →

conversational recommender systems robustness evaluation adversarial examples malicious users user preferences

发现论文，激发创造

对话式推荐系统的进展与挑战：综述

本文系统地回顾了当前对话式推荐系统（CRSs）的技术，总结了 CRSs 开发中的 5 个关键方向：基于问题的用户偏好获取、多轮对话推荐策略、对话理解和生成、开发利用折中和探索等方法的算法、以及 CRSs 的评估和用户模拟问题，并根据这些研究方向讨论了一些未来的挑战和机遇。

Jan, 2021

对话式推荐系统调查

本文详细调查了面向会话的推荐技术现有的方法，将这些方法按支持的用户意向或背景知识等维度分类，同时讨论了技术方法、CRS 的评估，以及未来需要更多研究的领域。

Apr, 2020

INFACT: 一种用于对话推荐的在线人类评估框架

本文讨论了对话式推荐系统的评估方法，指出当前主要依赖离线计算度量方式可能存在不足，建议结合人类主观感受开展模型评价，以提高模型性能的准确性和有效性。

Sep, 2022

定制化对话推荐系统

本文提出了定制化对话推荐系统（CCRS）的概念，以提高用户体验，包括多样化的对话回复生成器和细粒度意向识别，并通过元学习的方法定制化模型参数，实验表明 CCRS 在推荐和对话服务方面具有优越性。

Jun, 2022

BARCOR: 面向会话推荐系统的统一框架

本文提出了一种基于 BART 的统一框架，针对面向对话推荐的两个任务（推荐和响应生成）设计了单一模型，另外还构建了一个电影领域的轻量级知识图谱，在自动化和人类评估方面都取得了最先进的表现。

Mar, 2022

通过偏差分析和语言模型增强的数据增强改进对话推荐系统

对话式推荐系统是一个快速发展的研究领域，随着语言建模技术的进步而备受关注。然而，目前的对话式推荐系统面临许多挑战，由于其相对新颖和现有贡献的有限性。本研究探讨了用于开发对话式推荐系统模型的基准数据集，并解决了多轮互动中固有的反馈循环所产生的选择偏差和多元受欢迎度偏差等潜在偏差。借鉴语言模型和数据增强技术的成功，我们提出了两种新的策略 “Once-Aug” 和 “PopNudge”，以增强模型性能并减轻偏差。通过对 ReDial 和 TG-ReDial 基准数据集进行广泛实验，我们展示了我们的数据增强方法在对话式推荐系统技术上的持续改进，并提供了解决多个新形成的偏差的更多见解。

Oct, 2023

通过反事实数据模拟改进对话式推荐系统

本文提出了一种名为 CFCRS 的对话推荐系统，该系统采用反事实数据模拟方法来减轻对话推荐系统中数据不足的问题，并设计了基于对话模式的多阶段模拟器和逐步优化数据增强策略的对抗训练方法

Jun, 2023

对话式推荐作为检索：一个简单而强大的基准模型

本文提出了一种 IR 式方法，将对话表示为查询，将物品表示为待检索的文档，扩展了用于检索的文档表示，并使用 BM25 检索器进行比较，证明了该方法比使用复杂外部知识的基线模型效果好，同时通过用户中心建模和数据增强来解决 CRS 的冷启动问题。

May, 2023

公平且鲁棒的推荐系统攻防设计讨论

本篇论文讨论了推荐系统中的道德和社会问题，特别是 malicious user bias 所致的偏见和攻击对推荐模型的影响，强调了设计公平和稳定的推荐系统的重要性，尤其针对深度学习协同过滤推荐系统的脆弱性。

Sep, 2022

探究面向对话系统的训练度量的鲁棒性

本文介绍一种对话系统对话回复的鲁棒性测试方法，利用对抗学习方法提取出优化得分的回复策略，并利用该方法测试最近提出的训练度量标准，发现它们均容易将相对简单且明显存在缺陷的策略高分，如直接复制对话环境中的部分内容拼成回复竟然可以超越甚至优于人类翻译的水平。

Feb, 2022