ICCVOct, 2023

TextPSG: 从文本描述生成全景场景图

TL;DR从纯文本描述中生成全景场景图,通过区域分组器、实体对齐器、段合并器和标签生成器构建无显式链接、无预定义概念集的场景理解框架,有效地提高了性能和鲁棒性。