May, 2017

强化学习机器人与代理的情感:一项调查研究

TL;DR本文是对强化学习智能体情感计算模型的首次综述。 主要聚焦于智能体/机器人的情感,而大多数忽略了人类用户的情感。 情感在决策制定中起着重要作用,通过影响动机和行动选择来识别其功能。 因此,计算情感模型通常根据代理决策制定体系构建,其中强化学习是重要的子类。 研究基于RL的代理​​情感对三个研究领域有用。 面向计算机学习研究人员,情感模型可以提高学习效率。 面向交互式ML和人机交互(HRI)社区,情感可以传达状态并增强用户投入。 最后,它使情感建模(AM)研究人员能够在成功的AI代理类中探索其情感理论。 该调查提供了情感理论和RL的背景。 它系统地解决了以下问题:1)可以从哪些基础维度(例如,稳态,评估)推导出情感,以及如何在RL智能体中建模这些维度; 2)从这些维度推导出什么类型的情感; 3)这些情感如何影响代理​​的学习效率或在社交信号方面有用。 我们还系统地比较了评估标准,并将其与重要的RL子域(例如,固有的动机和基于模型的RL)联系起来。 简而言之,此调查为希望在其RL代理中实现情感的工程师提供了实用的概述,并确定了未来情感-RL研究的挑战和方向。