Events defined by the interaction of objects in a scene are often of critical
importance; yet important events may have insufficient labeled examples to
train a conventional deep model to generalize to future object appearance.
activity recognition models that represent object interact
本文提出了一种高效的时间推理图 (TRG), 用于同时捕捉视频序列之间的外观特征和时间关系。通过构建可学习的时间关系图来探索多尺度范围上的时间关系。在多头时间邻接矩阵的帮助下,提出了一个多头时间关系聚合器来提取那些通过图卷积计算的特征的语义含义。实验证明,通过我们的 TRG 进行时间关系推理可以提取用于活动识别的判别特征。