Nov, 2022

关系提取的单模态和多模态表示训练

TL;DR通过排除每种数据类型并独立评估文本和布局数据,我们研究了文本、布局和视觉信息的相对预测能力,证明了针对关系提取任务训练联合表示的有效性。我们的实验表明,双模态的文本和布局方法表现最佳,同时文本是最重要的单一预测因子,布局几何形状也具有高度预测能力。此外,我们强调在哪些情况下视觉信息可以增强性能。