Mar, 2023

通过对抗示例评估会话推荐系统的鲁棒性

TL;DR本文介绍了一个对话推荐系统(CRSs)的鲁棒性评估方案,其中自动生成敌对样本以评估系统在不同输入数据面前的鲁棒性。通过执行这些敌对样本,我们可以比较不同 CRSs 满足用户偏好的能力,并表明测试的三个 CRSs 都不够稳健和可靠。