CVPRJun, 2022

基于合成数据的实例分割的并行预训练 Transformer (PPT)

TL;DR本文提出了一种并行预训练 Transformer(PPT)框架,利用模拟渲染和物理学生成高质量的图像注释对,实现基于合成数据的实例细分任务。该方法采用现成的预训练视觉 Transformer 来缓解自然与合成数据之间的差距,从而在少量样本的下游合成数据场景中提供良好的泛化效果。试验结果表明,PPT 在 CVPR2022 AVA Accessibility Vision and Autonomy Challenge 中排名第一,mAP 为 65.155%。