ICLRJan, 2024

本地敏感稀疏编码用于在线学习世界模型

TL;DR在线学习是一项具有挑战性的任务,由于数据非稳态性,神经网络通常会导致灾难性遗忘,线性回归模型支持非线性随机特征,以实现高效的 Follow-The-Leader 更新,通过局部敏感稀疏编码实现高维非线性特征的高效稀疏更新,我们验证了编码的表达能力,并验证其在数据协变转移下实现了高效的在线学习,同时在 Dyna MBRL 环境中,我们的在线学习的世界模型与使用回放和其他持续学习方法训练的深度世界模型相匹配或超过了性能。