May, 2023

基于大型语言模型的复合视觉线索进行零样本视觉关系检测

TL;DR通过使用 RECODE 方法,利用预训练图像 - 语言模型,我们能够解决零样本可视关系检测中存在的问题,提高了关系检测的准确性和可解释性。