Jul, 2020

快速注意力实时语义分割

TL;DR该论文提出一种新的 CNN 模型结构和快速空间注意力机制,能够在实时高分辨率图像和视频上进行语义分割,同时实现更好的准确性和速度。在 Cityscapes 数据集中,该模型在单个 Titan X GPU 上实现了 74.4% mIoU 的 72 FPS 和 75.5% mIoU 的 58 FPS,比现有方法快约 50%,并保持相同的准确性。