Jul, 2021

在线动作检测的长短期 Transformer

TL;DR提出了一种长短时 Transformer(LSTR)算法,用于在线动作检测,它采用了长短时记忆机制来建模长序列数据,其中编码器动态地利用拓展的时间窗口的历史信息,解码器专注于一个短时间窗口来建模数据的细节特征。与先前的工作相比,LSTR 提供了一种有效且高效的建模长视频的方法,其在三种标准的在线动作检测基准测试(THUMOS'14、TVSeries 和 HACS Segment)上实现了最先进的性能。