Oct, 2022

使用冻结视觉-语言模型进行开放式语义分割

TL;DR本文提出了Fusioner方法,将自然语言和视觉特征融合用于零样本学习,且通过在多个自监督模型上进行实验展示了Fusioner的普适性。实验结果表明该方法表现优异且鲁棒性强。