变分转换器网络用于布局生成
本文探讨了一种新的图像条件布局生成的范式,通过采用自我关注机制和交叉关注机制来建立布局元素间的关系并结合条件图像的视觉信息生成各种布局,其中几何对齐模块可以消除元素域和视觉域之间的差距,在大规模广告海报布局设计数据集上进行的实验结果表明,我们的模型可以自适应地生成非侵入式区域的布局,从而实现和谐的布局设计。
Sep, 2022
本文提出了变分 Transformer(VT)算法,将变分自注意力前馈序列模型与 CVAE 的变分性质相结合,从而有效处理对话响应生成领域中高熵任务的问题,并在多个对话数据集上获得了性能提升。
Mar, 2020
该研究探讨了扩散模型在条件布局生成中的潜力,并提出了基于 Transformer 的布局扩散模型 (LayoutDM),该模型能够产生高质量、具有样本多样性、保真分布覆盖和稳定训练的图形设计布局。
May, 2023
本文介绍了一种学习型模块(VTN,即体积变形网络),以预测通道级扭曲场,从而在空间和通道层面上重新配置 CNN 特征,改善空间不变性技术在大规模对象识别中的限制。经实验证明,VTN 不断提升模型性能和图像识别和检索的精度。
Jul, 2020
提出了一种变分空间转换自编码器(VTAE),通过在 Riemann 流形上最小化测地线来改善表征学习,并提高计算机视觉任务的预测准确性和适用性,包括图像插值和重构。
Apr, 2023
本文提出了一种基于转换器和变分自动编码器(VAE)的条件变分自动编码器(CVAE)方法,在保持卓越的生成效果的同时增强了可控性和表征学习能力,实现了对长文本的神经故事生成。
Jan, 2021
LayoutVAE 是一种基于变分自编码器的场景布局生成框架,它可以根据文本或标签生成场景布局,检测布局异常问题,并在 MNIST-Layouts 和 COCO 2017 Panoptic 数据集上取得了良好的效果。
Jul, 2019
本论文提出了一种新的框架 LayoutTransformer,可以通过自注意力学习布局元素之间的上下文关系,并在给定领域中生成新的布局,并能够在多个不同数据领域中表现出色。
Jun, 2020