May, 2024

面向上下文的多变动字幕中的差异提取

TL;DR该研究提出了一种新颖的上下文感知差异提取(CARD)网络,用于描述自然语言中图像对中的复杂和耦合变化,通过捕捉所有真实的变化来生成句子,并在三个公共数据集上展示了优于现有方法的性能。