Jun, 2022

BYOL-Explore: 基于自举预测的探索

TL;DRBYOL-Explore 通过优化单一预测损失,在潜在空间中学习世界表示、世界动态和探索策略,实现在视觉复杂环境下的好奇心驱动探索。此方法可有效解决部分可观察连续行动的具有挑战性的难度探索基准和 Atari 游戏等任务。