ICLRApr, 2022

面向连续学习的信息论在线记忆选择

TL;DR本文是关于使用信息论从数据流中选择回放内存的在线选择问题的研究,提出了 Surprise 和 Learnability 准则,并使用贝叶斯模型高效地计算这些准则,进一步引入信息熵随机采样器(InfoRS)来选择高信息熵的点进行采样。在连续学习基准测试中,验证了它的效率和功效。