CVPRApr, 2022

LayoutBERT: 面向物体插入的掩码语言布局模型

TL;DRLayoutBERT 提出了一种基于自监督掩蔽语言模型目标和双向多头自注意力的自动图像叠加技术,主要用于解决自动选择对象并在图像中正确放置的难题,并在 COCO、PublayNet 等数据集上取得了较好表现,同时还提供了一个包含 580 万个包括布局注释的图像数据集。