Feb, 2022

循环双向交互的基于短语的可供性检测

TL;DR本文提出了一种基于视觉 - 语言角度的,循环双边一致性增强网络(CBCE-Net)来检测与对象互动的可能性,通过对公开的 Purpose-driven Affordance Dataset (PAD) 进行扩展,使用短语注释了能力类别。实验结果证明了我们的方法在目标评价指标和视觉质量两方面均优于相关领域的九种典型方法。