Jan, 2021

关于视觉语言导航指令的评估

TL;DR该研究发现BLEU、ROUGE、METEOR和CIDEr指标无法有效评估基于视觉与语言的导航生成器自动生成的导航指令,提出了一种不依赖参考指令的指令-轨迹相容性模型,并建议在有参考指令时使用SPICE进行评估。