Jun, 2023

长短文本联合预测网络:应用于指代视频目标分割

TL;DR本文提出了一种基于短文本表达的参考视频对象分割方法,结合长短文本表达进行联合预测,并引入了一种前向 - 后向视觉一致性损失,实现了在 A2D-Sentences 和 JHMDB-Sentences 数据集上表现出的显著性改进。