ICLRApr, 2023

倒行逆施前行:基于行动影响的嵌入在行动语义之上

TL;DR通过使用潜在嵌入来即时建模行为的影响,在行为自适应策略(AAP)中设计了一种新的基于 Transformer 的策略头,该策略被用于两个具有挑战性的视觉导航任务中,即使在推理时缺少行为和先前未见过的扰动行为空间时,也表现出很高的性能和鲁棒性。