ECCVDec, 2021

图像和点云的语言基础的自底向上和自顶向下检测变压器

TL;DR提出了一种语言引导的物体检测模型,使用底部和顶部的启发式信息来实现参考指称地面实体,同时获得了在流行的 3D 语言基础基准测试中的新的最先进的性能表现,与以前的技术相比显著提高。