CVPRMar, 2024

基于 Transformer 的视觉关系检测中的群组查询专业化与质量感知多指派

TL;DR在此研究中,我们提出使用 Groupwise Query Specialization 和 Quality-Aware Multi-Assignment (SpeaQ) 的方法来解决传统标签分配中的两个问题,从而有效地训练专门化的查询,提高 Visual Relationship Detection (VRD) 的性能。