Sep, 2018

使用不对称标注的实时联合语义分割和深度估计

TL;DR利用深度学习模型在机器人中作为感知信息提取器的部署,有许多困难之处。本文着重探讨了其中三个最显著的障碍,即如何将单个模型适应于同时执行多个任务的需求、如何实现实时性、以及如何使用具有不对等标注数量的非对称数据集。通过使用实时语义分割网络和知识蒸馏的简单解决方案,我们将这些障碍一一克服。最终,我们的系统可以方便地扩展,使用单个模型同时处理更多任务和未来更多的数据集,能够在室内和室外分别执行深度估计和分割,并在 640x480 像素的输入上只需要一个前向通道即可实现 13ms 和 6.5 GFLOPs 成本的效果,从而直接将其用于场景的 3D 语义重建中。