ICCVAug, 2023

基于事件引导的通过文本监督的指导视频的流程规划

TL;DR本研究针对从带有文本监督的指令视频中进行过程规划的任务,提出了一种基于事件引导的范式,通过从观察到的状态中推断事件并基于状态和预测的事件规划行动。在提出的模型中,还采用了遮盖和预测方法进行关系挖掘,通过将事件信息编码到顺序建模过程中来支持过程规划。实验证明了我们提出的模型的有效性。