Jun, 2021

学习任务感知抽象化

TL;DR本研究提出了一种基于任务感知的马尔可夫决策过程(TiMDP)的形式化方法,利用学习任务信息抽象(TIA)来改善现有基于模型的强化学习在复杂视觉场景中处理的困难,并取得了显著的性能提升。