ACLJun, 2023

文本、表格和图像问答的统一语言表示

TL;DR本文提出了一种新的跨模态推理方式,即将图像和表格转换为统一的语言表示,以简化任务并利用先前训练好的语言模型,同时介绍了一种名为 Solar 的框架,实验结果表明,Solar 在两个数据集上的表现优于所有现有方法,并在 WebQA 排行榜上取得了最佳成绩。