Mar, 2022

使用分层视觉语言知识蒸馏进行开放词汇单阶段检测

TL;DR本文提出了一种层次化的视觉 - 语言知识蒸馏方法 (HierKD) 用于开放词汇的单阶检测,该方法探索全局级别的知识蒸馏来传递来自预训练视觉语言模型的未知类别的知识到检测器,并将全局级别知识蒸馏和常见的实例级别知识蒸馏相结合,从而同时学习已知和未知类别的知识,实验结果表明,与最好的二级检测器相比,我们的方法在零样本检测和广义零样本检测设置下分别取得了 11.9%和 6.7%$AP_{50}$ 的增益,同时将 $AP_{50}$ 性能差距从 14%降低至 7.3%。