Oct, 2022

使用冻结视觉 - 语言模型进行开放式语义分割

TL;DR本文提出了 Fusioner 方法,将自然语言和视觉特征融合用于零样本学习,且通过在多个自监督模型上进行实验展示了 Fusioner 的普适性。实验结果表明该方法表现优异且鲁棒性强。