Nov, 2019

使用自然语言查询进行交互式检索复杂场景的逐层钻取

TL;DR本文提出了 Drill-down,该方法可以使用自然语言进行交互式图像检索,能够在包含多个对象的复杂图像场景中有效地使用多轮查询和弱监督,这种方法展现了优越的表现。