Jan, 2025

大型多模态模型是否解决了科学图形的标题生成问题?来自2023年SCICAP挑战的经验教训

TL;DR本研究解决了科学图形标题生成领域的研究缺口,特别是在2023年SCICAP挑战中,展示了不同模型在这一任务上的效果。研究发现,专业编辑倾向于选择GPT-4V生成的图形标题,其表现优于其他模型及原作者的标题,这表明先进的大型多模态模型在此任务上取得了显著进展。