Nov, 2016

联合推断与视觉上下文下的密集字幕

TL;DR本研究提出了一种基于 “联合推理” 和 “上下文融合” 的模型管道来解决密集字幕的两个关键挑战,并在 Visual Genome 上取得了目前最佳算法的相对增益 73%的最新成果。