Apr, 2019

利用视觉上下文辅助多模式命名实体识别中的文本内表示

TL;DR本文在 Twitter 和 Instagram 等社交媒体大规模爆炸的情况下,探索了基于多媒体发布中关于实体识别的问题。我们提出了一种端到端模型,学习了文本和图像的联合表示。模型扩展了多维自我关注技术,其中现在图像有助于增强单词之间的关系。实验表明,我们的模型能够更精确地捕捉文本和视觉语境,实现了 Twitter 多模式命名实体识别数据集的最新结果。