ICMLFeb, 2021

DRIBO: 多视角信息瓶颈下的鲁棒深度强化学习

TL;DR本研究利用多视角设置引入对比的多视图信息瓶颈目标训练深度强化学习代理程序,从而可以学习到能够保留任务相关信息但压缩掉任务不相关信息的强大的表示,进而训练出具有鲁棒性和泛化性的高性能政策。