Mar, 2022

探索基于光流引导的运动和检测的外观在长时句子理解中的应用

TL;DR本文提出了一种运用运动和外观引导的三维语义推理网络(MA3SRN)实现时序句子定位,该网络能准确地建模相邻帧之间的活动,并获得在三个具有挑战性的数据集上的最新最好成果。