Mar, 2023

信息门控:通过信息门控实现强鲁棒控制

TL;DR本文提出了一种信息门控方法,利用像素空间中信息的最小化来获得更加简洁的表示方法,实现对于噪声和无关联信息的鲁棒性和泛化性,通过在像素层级应用可微分的信噪比参数化,提出 InfoGating,用于多步前向和逆向动力学、Q学习、行为克隆和标准的自监督任务中,并展示考虑信息最小化可改善下游任务中模型的泛化性能。