May, 2024

基于深度次模优化:从长篇多模态文档生成海报

TL;DR提出了一种新颖的深度子模函数,该函数可以根据输入文档的地面真实摘要提取多模态内容,并明确确保文字和图像的覆盖范围、多样性和对齐性。在此基础上,使用基于LLM的复述器生成以输入内容为条件的具有各种设计方面的模板,并通过广泛的自动化和人工评估展示了我们方法的优点。