CVPRMar, 2022

FLOAT: 改善多目标多部件场景分析的因式学习对象属性

TL;DR本文提出 FLOAT 框架,它是一个因式化的标签空间框架,可以有效地实现多对象和多部分图像场景的分割和语义分析。FLOAT 的独立密集预测对象和部分属性,减少了任务复杂度并提高了可扩展性,而推理时的 “缩放” 细化技术可以显著提高细分质量。与现有技术相比,FLOAT 在 Pascal-Part-58、Pascal-Part-108 数据集上,分别实现了 2.0%、2.1% 的 mIOU 和 4.8%、3.9% 的 sqIOU 的绝对提升。我们使用 Pascal-Part 数据集来创建最全面和具有挑战性的数据集 Pascal-Part-201,并实现 8.6% 的 mIOU 和 7.5% 的 sqIOU 的改进,证明了 FLOAT 在对象和零件的多样性中的有效分割。