ECCVDec, 2021
图像和点云的语言基础的自底向上和自顶向下检测变压器
Bottom Up Top Down Detection Transformers for Language Grounding in Images and Point Clouds
Ayush Jain, Nikolaos Gkanatsios, Ishita Mediratta, Katerina Fragkiadaki
TL;DR提出了一种语言引导的物体检测模型,使用底部和顶部的启发式信息来实现参考指称地面实体,同时获得了在流行的 3D 语言基础基准测试中的新的最先进的性能表现,与以前的技术相比显著提高。