Nov, 2023

FRAC-Q-Learning:一种避免无聊过程的社交机器人强化学习

TL;DR该研究提出了一种专门用于社交机器人的新型强化学习方法,FRAC-Q-learning,它具备避免用户厌烦的能力。通过与传统的Q-learning进行比较,实验证明FRAC-Q-learning在兴趣分数上显著较高,相对传统Q-learning更难让用户感到厌烦,因此该算法有望帮助开发不会令用户感到厌烦的社交机器人,并能够在基于Web的通信和教育系统中找到应用。该论文首次全面介绍了FRAC-Q-learning的整个过程、详细实现和评估方法。