Apr, 2023

通过对比行为总结展示自主机器人能力

TL;DR本文提出了一种自适应搜索方法,用于有效生成对比行为总结,该方法支持连续状态和操作空间,并通过用户研究证明其可以帮助人们在有限的观察时间预算内准确选择表现更好的自主代理人。