Jan, 2020

基于深度的语义场景完形填空与位置重要性感知损失

TL;DR本文提出了基于单个深度输入的混合网络 PALNet,利用两个流提取 2D 和 3D 特征,使用细粒度深度信息有效捕获场景的上下文和几何线索,并提出了 Position Aware Loss 以确定不同位置的重要性,从而使得场景的不同部分能够得到更好的恢复。文章的实验结果表明了所提出方法的有效性及卓越性能。