学习生成科学论文海报
该研究介绍了一种高度自动化和内容感知的广告海报生成系统 AutoPoster,通过图像清理和重定向、布局生成、标语生成和样式属性预测等四个关键阶段,该系统可以仅凭产品图像和标题自动生成不同尺寸的海报。通过融合两个内容感知模型用于布局和标语生成,同时提出了一种用于联合预测视觉样式属性的新型多任务样式属性预测器 (SAP)。此外,我们提出了首个包含超过 76k 海报视觉属性注释的海报生成数据集。用户研究和实验证明了我们的系统的有效性以及生成的海报在美学上相较其他生成方法的优势。
Aug, 2023
通过 visual-textual 和 geometry 关系感知模块,提出一种基于 CGL-Dataset V2 数据集的海报布局生成方法,可以考虑海报的视觉和文本内容以及元素之间的关系,生成能够传达文本信息的多样化的海报布局,优于现有方法。
Jun, 2023
提出了一种新颖的深度子模函数,该函数可以根据输入文档的地面真实摘要提取多模态内容,并明确确保文字和图像的覆盖范围、多样性和对齐性。在此基础上,使用基于 LLM 的复述器生成以输入内容为条件的具有各种设计方面的模板,并通过广泛的自动化和人工评估展示了我们方法的优点。
May, 2024
本文旨在研究如何通过条件生成对抗网络来实现内容感知的视觉文字呈现布局,为自动无模板创意图形设计提供关键支持。通过设计一个名为 PosterLayout 的新数据集,并借助设计顺序形成技术,提出一种可生成适当布局的 CNN-LSTM 基于条件生成对抗网络,该方法在多个方面均取得了最佳性能。
Mar, 2023
一个名为 P&R 的新型产品海报生成框架,结合了设计师在创作海报时的工作流程,利用 PlanNet 生成产品和其他可视组件的布局,利用 RenderNet 生成产品的背景,通过空间融合模块融合不同可视组件的布局,提供了一种提高多样性和合理性的产品海报生成方法。
Dec, 2023
本文提出了一种新的科学图表标题生成方法,通过自然语言处理、机器学习和多模态技术,从图表中提取关键信息并生成准确简洁的标题,以提高研究数据的清晰度和可访问性。
Jun, 2024
PosterLlama 是一种生成视觉上连贯且文本相关的布局的网络,通过重新格式化布局元素为 HTML 代码并利用语言模型中嵌入的丰富设计知识来进行设计,通过独特的基于深度的海报增强策略提高模型的鲁棒性。在多个基准测试中,PosterLlama 在生成真实且内容感知的布局方面优于现有方法,支持无条件布局生成、元素条件布局生成、布局完成等条件,并作为一种高度灵活的用户操作工具。
Apr, 2024
基于计算设计方法的排版设计评估,通过启发式度量标准考察了可读性、美学价值和语义特征,实验采用受限演化方法生成排版海报,将评估度量作为约束条件,并结合情感识别自动识别文本语义,分析了方法和视觉特征的性能。
Feb, 2024
本文介绍了一种基于深度转换网络和概率模型的电影海报图像自动多标签类型识别方法,不需要任何额外的文本或元数据信息,通过实验分析在 13882 个电影海报中的 13 个类型中表现出色并超过了一些主要的现代架构。
Sep, 2023
我们提出了一种端到端的文本渲染框架,利用三重交叉关注机制在细致的背景环境中创建精确的海报文本,验证了该方法生成具有复杂和丰富背景的海报图像的能力。
Jul, 2024