Mar, 2022
深入探讨视频中去偏置的时间句子定位:数据集、度量和方法
A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach
TL;DR本文提出了一种新的视频文本时间对齐评估协议,包括将常用的数据集重新组织为不同的分布以及引入一种新的评估度量方法。此外,作者还提出了一种基于因果关系的多分支去偏置去混淆框架,帮助模型更好地对齐句子查询和视频片段的语义,实现了更好的性能。