Feb, 2022

基于持续时间的 Vlog 叙述动作时间定位研究

TL;DR本文研究生活时尚视频中的时间人类行为定位,提出一个基于预期持续时间的简单而有效的方法,该方法使用数据集手动注释的 13,000 个行动,并分析它的语言和可视模态交互,并通过实验证明,相对于以往方法,该方法具有补充信息,并且在时间行动定位任务上的性能更好。