ACLJun, 2023

PV2TEA:将视觉模态补充到文本信息提取中

TL;DR该研究旨在将视觉模态与以文本为基础的属性信息提取器相结合,以提高属性值提取的准确性和性能,在此基础上,该文提出了基于编码器 - 解码器结构的 PV2TEA 模型,通过三种偏差降低方案实现跨模态融合,并实验证明相比于单一模态模型,其性能提高了 20.97%.