May, 2020

信息瓶颈方法控制合理化提取中的简洁性

TL;DR本文通过优化信息瓶颈(IB)目标的界限,提出了一种新的完全无监督方法, jointly 学习解释器和端任务预测器,通过可调的稀疏先验直接控制掩码的稀疏性水平。在 ERASER 基准任务上的实验表明,使用 IB 相比于 norm-minimization 技术,在任务性能和与人类理性的一致性方面都取得了显著的收益。此外,我们发现在半监督学习的情况下,对于训练样本的25%的黄金理性,能够弥补使用完整输入的模型的差距。