Aug, 2023

SCoRD:基于文本增强数据的主体条件关系检测

TL;DR基于 Open Images 数据集,我们提出了一种挑战性的 OIv6-SCoRD 基准,通过条件化输入主体来预测其与场景中其他对象的所有关系及其位置。我们提出了一种自回归模型,通过将输出解释为一个标记序列,预测主体的关系、对象和对象位置,提高了关系 - 对象和对象 - 框预测的泛化能力。