Oct, 2023

反向决策建模:学习行为的可解释表示

TL;DR通过开发一个逆向决策建模的框架,我们在这篇论文中提出了一种表达顺序决策行为的参数化表示的方法,该方法不仅泛化了现有的模仿/奖励学习工作,而且还打开了更广泛的行为表征研究问题的研究领域。