Dec, 2022
DePlot: 使用绘图表格转换的一次性视觉语言推理
DePlot: One-shot visual language reasoning by plot-to-table translation
Fangyu Liu, Julian Martin Eisenschlos, Francesco Piccinno, Syrine Krichene, Chenxi Pang...
TL;DR该论文提出了首个一次学习解决视觉语言推理的解决方案,其利用名为 DePlot 的模态转换模块,将绘图或图表的图像转换为线性化表格,并与大型语言模型结合使用,取得了 24%的进展。