May, 2023

基于时空注意力的实时视频识别语义压缩

TL;DR本文研究边缘计算中视频动作识别的计算卸载。为了实现有效的语义信息提取,本文提出了一种新的空时注意力自编码器(STAE)结构,包括帧注意力模块和空间注意力模块。实验证明,在时间约束下,与 DeepISC 的基准模型相比,基于 STAE 的 ViT 模型具有更快的推理速度和更高的准确性。