修订的重要性：以修订编辑为指导的生成设计

May, 2024

修订的重要性：以修订编辑为指导的生成设计

Revision Matters: Generative Design Guided by Revision Edits

Tao Li, Chin-Yi Cheng, Amber Xie, Gang Li, Yang Li

TL;DR通过研究人员的修订编辑如何改进多模式生成模型，本文探讨了如何在预先训练的大型多模式模型中基于人类修订和人工指导的情况下实现迭代设计修订，结果表明人类修订在迭代布局改进中起到了关键作用。

Abstract

layout design, such as user interface or graphical layout in general, is fundamentally an iterative revision process. Through revising a design repeatedly, the designer converges on an ideal layout. In this paper

发现论文，激发创造

理解人类文本中的迭代式修订

这项研究描述了IteraTeR：第一个大规模、多领域、编辑意图注释的迭代修订文本语料库，包括了新框架和注释后的编辑意图，提高了自动生成模型的评价，从而更好地理解文本修订过程，使得编辑意图和写作质量之间可以建立重要联系，并促进迭代修订文本的计算模型的多样性语料库的创建。

Mar, 2022

读、修改、重复：人类参与的文本迭代修订系统演示

本文介绍了一种人机交互的迭代文本修订系统(R3)，该系统可提供高质量的文本修改建议，通过人机交互实现文档的迭代修订，从而使大语言模型在文本修订任务中发挥更大作用。

Apr, 2022

Idea2Img：基于GPT-4V（ision）的迭代自我优化的自动图像设计与生成

引入了“Idea to Image”系统，利用GPT-4V(Vision)进行多模态迭代自我精炼，实现自动图像设计与生成。

Oct, 2023

Design2Code: 前端工程自动化的实现程度如何？

通过综合评估，我们发现GPT-4V在将视觉设计转换为代码实现的任务中表现最佳，其生成的网页在视觉外观和内容方面可以替代原始参考网页的49％，并且在64％的情况下被认为比原始参考网页更好。

Mar, 2024

VISION2UI：从UI设计生成代码的带有布局的真实世界数据集

从实际场景中提取和清洗，包含设计愿景和UI代码的高质量数据集VISION2UI用于细调Multimodal Large Language Models (MLLMs)以实现自动化UI代码生成。

Apr, 2024

视觉丰富文档的自动布局规划与指导模型

近期，在指令追踪模型方面取得的进展使得用户与模型的交互更加用户友好和高效，扩大了它们的适用范围。本研究引入了一种新颖的多模态指令追踪框架，用于布局规划，在设计领域，非专业用户经常由于技能和资源有限而难以创建具有视觉吸引力的布局。我们提出了三个布局推理任务来训练模型理解和执行布局指令。在两个基准测试中的实验证明，我们的方法不仅简化了非专业人员的设计过程，而且在Crello上的mIoU高于few-shot GPT-4V模型12%。这一进展凸显了多模态指令追踪模型在自动化和简化设计过程方面的潜力，为视觉丰富文档上的各类设计任务提供了可行的解决方案。

Apr, 2024

利用人工修订改进文本布局模型

通过利用人类修订技巧，本研究提出了利用细致反馈的奖励模型的方法，以加强生成模型的对齐性和性能。

May, 2024

InstructLayout: 基于语义图先验的指导式2D和3D布局合成

InstructLayout是一种集成了语义图先验和布局解码器的新型生成框架，用于改善2D和3D布局合成的可控性和保真度，通过同时学习布局外观和对象分布，实现了多个下游任务的零样本表现。

Jul, 2024

重新思考丰富上下文的布局到图像生成的训练和评估

本研究解决了布局到图像生成中，现有方法在复杂文本描述场景下表现不佳的问题。提出了一种新颖的区域交叉注意力模块，以增强生成过程，并提出了评估开放词汇情景下生成性能的新指标。研究发现，这些指标与人类偏好高度一致，具有重要的应用潜力。

Sep, 2024

布局校正器：缓解离散扩散模型中的布局粘滞现象

本研究针对当前离散扩散模型在生成布局后难以校正不和谐布局的问题，提出了一种名为布局校正器的模块。该模块通过识别布局中的不和谐元素，并重新生成和谐的布局，显著提升了布局生成的性能，展现了在高效控制布局和谐性方面的潜力。

Sep, 2024