EMNLPMay, 2022

图像文本生成的进展 —— 以自我合理化为案例研究

TL;DR探索多模态模型在联合图像和文本生成任务中的表现,并发现单一模型类型不能通用地在所有任务、数据集和微调数据大小上表现最佳,加深了对从图像和文本生成超越图像字幕的新型通用骨干方法的需求。