Jan, 2024
UMIE: 统一多模态信息提取与指导调整
UMIE: Unified Multimodal Information Extraction with Instruction Tuning
Lin Sun, Kai Zhang, Qingyuan Li, Renze Lou
TL;DR多模态信息提取通过指令调整以解决当前面临的任务特定模型结构的持续问题,提供了一个统一的多模态信息提取器 UMIE,能够有效地提取文本和视觉提及,并在六个多模态信息提取数据集上的三个任务中在零样本模型、指令变体和可解释性方面都表现出强大的泛化能力。