May, 2021

跨模态逐步理解用于区域引用的分割

TL;DR本文提出了一个跨模态的渐进式理解方案,分别应用于图像和视频的参考分割中,通过使用实体,属性和关系词汇进行空间图形推理和时间图形推理来解决语言表达的主语并输出像素级掩码。