ICCVSep, 2023

视频任务百项全能:在自动驾驶中统一图像和视频任务

TL;DR通过设计统一模型 VTDNet 和挑战集 Video Task Decathlon (VTD),并且采用 Curriculum training, Pseudo-labeling 和 Fine-tuning (CPF) 训练方案,本研究在自动驾驶中的图像和视频识别任务取得了突破性的进展,显著提高了性能并减少了计算量。