Nov, 2023

基于详细人类中心文本描述的大规模场景合成

TL;DRDetText2Scene 是一种新颖的文本驱动大规模图像合成方法,具有高度的忠实度、可控性和自然性,在全局范围内实现了对详细人类中心化文本描述的合成。