Dec, 2022

MatCha:利用数学推理和图表解渲染增强视觉语言预训练

TL;DRMatCha 通过数学推理与图解构造预训练,增强了视觉语言模型的建模能力,成功提高了如 PlotQA 和 ChartQA 等标准基准测试的表现,证实了该方法在更广泛的视觉语言任务上的有效性和可行性。