Jan, 2023

基于向量量化模型的分层仿真学习

TL;DR本文提出使用强化学习来识别专家轨迹中的子目标,从而构建一个向量量化生成模型,以进行子目标级别的规划,并在复杂的长期决策问题上表现出色,优于现有技术。