强化学习机器人与代理的情感：一项调查研究

May, 2017

强化学习机器人与代理的情感：一项调查研究

Emotion in Reinforcement Learning Agents and Robots: A Survey

Thomas M. Moerland, Joost Broekens, Catholijn M. Jonker

TL;DR本文是对强化学习智能体情感计算模型的首次综述。主要聚焦于智能体/机器人的情感，而大多数忽略了人类用户的情感。情感在决策制定中起着重要作用，通过影响动机和行动选择来识别其功能。因此，计算情感模型通常根据代理决策制定体系构建，其中强化学习是重要的子类。研究基于RL的代理情感对三个研究领域有用。面向计算机学习研究人员，情感模型可以提高学习效率。面向交互式ML和人机交互（HRI）社区，情感可以传达状态并增强用户投入。最后，它使情感建模（AM）研究人员能够在成功的AI代理类中探索其情感理论。该调查提供了情感理论和RL的背景。它系统地解决了以下问题：1）可以从哪些基础维度（例如，稳态，评估）推导出情感，以及如何在RL智能体中建模这些维度； 2）从这些维度推导出什么类型的情感； 3）这些情感如何影响代理的学习效率或在社交信号方面有用。我们还系统地比较了评估标准，并将其与重要的RL子域（例如，固有的动机和基于模型的RL）联系起来。简而言之，此调查为希望在其RL代理中实现情感的工程师提供了实用的概述，并确定了未来情感-RL研究的挑战和方向。

Abstract

This article provides the first survey of computational models of emotion in reinforcement learning (RL) agents. The survey focuses on age