MMApr, 2020

新闻部门升级:新闻文章自动图片选取系统

TL;DR本文提出了一个自动化图像选择系统,用于协助编辑在新闻文章中选择合适的图片。该系统融合了从新闻文章中提取的多个文本来源,并接受多语言输入。它配备有字符级词嵌入,以帮助对形态丰富的语言建模,并在靠近的语言之间转移知识。文本编码器采用分层自注意机制,更多地关注文本中的关键字和新闻文章的信息组成部分。我们在瑞士本地新闻媒体网站收集的多模态多语言新闻文章的大规模文本 - 图像数据库上进行了广泛的实验。在弱监督学习设置中,将该系统与多个基线方法进行比较,并显示超过了现有的文本 - 图像检索方法。除此之外,我们还提供了使用多个文本来源和多语言数据的优势见解。