CVPRMar, 2021

自我监督多模态知识蒸馏:利用声音进行多物体检测与跟踪

TL;DR提出了一种新颖的自监督 MM-DistillNet 框架,利用多个教师的多样性模态(包括 RGB、深度和热成像)来同时利用互补线索并将知识蒸馏到单一的音频学生网络中,而且还引入了一种新的自监督假设任务来使我们不依赖于人工标注。该方法在探测物体方面具有优越性能,即使在移动的情况下也能使用声音来检测多个物体。