May, 2024

视觉系统的资源高效感知

TL;DR应对高分辨率图像处理中的计算挑战,提出了一种利用内存高效的基于块处理的框架,通过全局上下文表示和局部块信息实现对图像内容的全面理解,并在不受内存限制的情况下对超高分辨率图像进行训练,在分类、目标检测和分割等七个基准测试中取得了卓越性能,甚至在像 Jetson Nano 这样的资源受限设备上也能表现出色。