Jun, 2023
长短文本联合预测网络:应用于指代视频目标分割
LoSh: Long-Short Text Joint Prediction Network for Referring Video Object Segmentation
Linfeng Yuan, Miaojing Shi, Zijie Yue
TL;DR本文提出了一种基于短文本表达的参考视频对象分割方法,结合长短文本表达进行联合预测,并引入了一种前向 - 后向视觉一致性损失,实现了在 A2D-Sentences 和 JHMDB-Sentences 数据集上表现出的显著性改进。