Mar, 2024

量化逆强化学习对错误规范的敏感性

TL;DR逆向强化学习(IRL)的关键问题是行为模型的错配性对结果的影响,本研究对此进行敏感性分析,并分析参数值和模型参数错配对结果的影响。