Jan, 2024

在摩擦任务中对有限理性人类代理采取强化学习干预

TL;DR引入行为模型强化学习(BMRL)框架,利用人类决策者的智能规划特性,通过个性化干预实现对摩擦性任务中基本行为的理解和对复杂行为的规划。