Jul, 2024

基于最优传输多边形匹配的多模式基础模型的开放词汇操纵指令的目标分割

TL;DR从开放式词汇指令生成分割蒙版的新方法,使用最优传输创建一种新的损失函数以避免多边形顶点顺序错误导致错误的蒙版生成。使用基于 REVERIE 数据集和 Matterport3D 数据集构建的新数据集评估了该方法,结果表明该方法比现有蒙版生成方法更有效,最佳模型在该数据集上相对于一个代表性的基于多边形的方法改进了 16.32%。