May, 2024

逆凹效用增强学习即逆博弈论

TL;DR我们提出了新的逆反强化学习问题的理论框架,将 concave function 应用于 CURL,并创造性地将其等效于 mean-field games 的逆博弈理论问题,从而揭示了 CURL 问题与传统逆强化学习不同的特性和挑战。