Mar, 2022

推理反事实以改善人类逆强化学习

TL;DR为了让人类能够很好地与机器人协作,提出了一种包含逆强化学习和演示方法,在选择展示时考虑了人类对机器人决策的预期,使用了一种新的测试难度测量方法,并发现这种方法在易于测试的情况下降低了人类的性能,但在难于测试的情况下增加了性能。