Nov, 2023
REACT:普遍识别每个行为的即刻地点
REACT: Recognize Every Action Everywhere All At Once
Naga VS Raviteja Chappa, Pha Nguyen, Page Daniel Dobbs, Khoa Luu
TL;DRREACT 是一种新颖的架构,受到了 Transformer 编码器 - 解码器模型的启发,旨在模拟视频中复杂的上下文关系,包括多模态和时空特征的交互。该方法在广泛的实验证明,在识别和理解群体活动方面表现出优越的准确性,为细致的场景理解提供了稳健的框架。