CVPRJun, 2024

高分辨率开放词汇对象 6D 姿态估计

TL;DRHoryon 是一种基于开放词汇量的 Vision-Language Model 架构,通过使用自然语言描述来解决视觉中六维位姿估计任务中未见过对象之间的相对位姿估计问题,并在四个数据集上实现了最先进的性能,优于之前的方法。