ECCVAug, 2016

为指称表达理解建模物体间的语境关系

TL;DR提出了一种技术,该技术通过整合对象之间的上下文来理解指代表达式,使用 LSTM 学习指代表达式的概率,并利用多示例学习 (MIL) 方法发现上下文区域,使用最大边际 MIL 目标函数训练 LSTM,实验结果表明,与仅建模对象属性相比,建模对象间上下文可以提供更好的性能,并可以定量地表明该技术可以将指涉表达式与支持的上下文区域联系起来。