ICCVSep, 2023
视频任务百项全能:在自动驾驶中统一图像和视频任务
Video Task Decathlon: Unifying Image and Video Tasks in Autonomous Driving
Thomas E. Huang, Yifan Liu, Luc Van Gool, Fisher Yu
TL;DR通过设计统一模型 VTDNet 和挑战集 Video Task Decathlon (VTD),并且采用 Curriculum training, Pseudo-labeling 和 Fine-tuning (CPF) 训练方案,本研究在自动驾驶中的图像和视频识别任务取得了突破性的进展,显著提高了性能并减少了计算量。