May, 2024
逆凹效用增强学习即逆博弈论
Inverse Concave-Utility Reinforcement Learning is Inverse Game Theory
Mustafa Mert Çelikok, Frans A. Oliehoek, Jan-Willem van de Meent
TL;DR我们提出了新的逆反强化学习问题的理论框架,将 concave function 应用于 CURL,并创造性地将其等效于 mean-field games 的逆博弈理论问题,从而揭示了 CURL 问题与传统逆强化学习不同的特性和挑战。