EMNLPOct, 2023

LACMA:语言对齐的对比学习和元动作用于体现式指令跟踪

TL;DR通过对代理的隐藏状态与指令进行对比学习,以及引入元动作来缩小高级语言指令与代理低级行动空间之间的语义差距,该研究成功提高了代理在未知环境下的成功率。