ACLMay, 2020
话语不够,次序至关重要:关于视觉指称表达的鲁棒性
Words aren't enough, their order matters: On the Robustness of Grounding Visual Referring Expressions
Arjun R Akula, Spandana Gella, Yaser Al-Onaizan, Song-Chun Zhu, Siva Reddy
TL;DR该论文研究了视觉指代表达识别这一挑战性任务,发现现有方法未能充分利用语言结构,提出了两种增强其健壮性的方法,并提供了数据集以供使用。