Dec, 2022

DePlot: 使用绘图表格转换的一次性视觉语言推理

TL;DR该论文提出了首个一次学习解决视觉语言推理的解决方案,其利用名为 DePlot 的模态转换模块,将绘图或图表的图像转换为线性化表格,并与大型语言模型结合使用,取得了 24%的进展。