ECCVAug, 2022

通过可散点学习统一视觉感知

TL;DRUniHead 使用 transformer encoder 实现视觉感知任务的统一处理,提供了一个简单、灵活、通用的视觉感知头,支持对象检测、实例分割和姿态估计等视觉任务,并在 ImageNet 和 COCO 数据集上进行了广泛的评估。