ICLRMar, 2024
从视频中实现强化学习的原则性表示学习
Towards Principled Representation Learning from Videos for Reinforcement Learning
Dipendra Misra, Akanksha Saran, Tengyang Xie, Alex Lamb, John Langford
TL;DR研究使用视频数据进行决策预训练表示学习,讨论两种情景:观察中的独立同分布噪声和存在外部噪声的困难情景,验证了在不同情境中学习表征方法的样本复杂度和性能表现。