May, 2015

视觉语义角色标记

TL;DR本文介绍了视觉语义角色标注的问题,即在给定图像的情况下,我们希望检测人们进行的动作并定位交互对象,为了实现这个目标,我们注释了一组数据集,并提供了一组基准算法来解决这个问题,并分析了错误模式,为未来的工作提供了方向。