Jun, 2023

基于时序和潜变量的对比损失的视觉强化学习方法:TACO

TL;DR本文介绍了一种名为 TACO 的时间驱动对比学习方法,通过优化当前状态与行动序列表示和相应未来状态表示之间的相互信息,同时学习状态和行动表示,并在深度强化学习的多个方面上实现了性能提升。