Jul, 2024

CoMix:多任务漫画理解的综合基准

TL;DR漫画领域通过单页分析和合成模型的发展正在迅速进步。我们提出了一个新的基准模型CoMix,旨在评估漫画分析模型的多任务能力。与现有基准模型专注于孤立任务相比,CoMix涵盖了更广泛的任务,包括目标检测、发言人识别、角色重新识别、阅读顺序、角色命名和对话生成等多模态推理任务。相比人工表现和最先进模型的比较结果显示出显著的表现差距,突出了在漫画理解方面的重大发展机遇。该数据集、基准模型和代码可在仓库链接中获取,为广大研究者提供了一个常用基准模型来评估漫画领域上大规模和多样化数据集的性能。