May, 2023
基于时空注意力的实时视频识别语义压缩
Spatiotemporal Attention-based Semantic Compression for Real-time Video Recognition
Nan Li, Mehdi Bennis, Alexandros Iosifidis, Qi Zhang
TL;DR本文研究边缘计算中视频动作识别的计算卸载。为了实现有效的语义信息提取,本文提出了一种新的空时注意力自编码器(STAE)结构,包括帧注意力模块和空间注意力模块。实验证明,在时间约束下,与 DeepISC 的基准模型相比,基于 STAE 的 ViT 模型具有更快的推理速度和更高的准确性。