Oct, 2023

图像叙述中的半监督多模态指代消解

TL;DR研究采用图像和描述性文本的多模态共指消解,在细粒度的图像-文本对齐、叙述语言的内在歧义和缺乏大规模标注数据集的条件下,提出了一种数据效率的半监督方法,用于解决多模态背景下的共指消解和叙述依托问题,通过跨模态框架结合有标注和无标注数据的损失优化,实验证明该方法在共指消解和叙述依托任务上的性能优于强基线模型。