Mar, 2021
低保真端到端视频编码器预训练用于时间动作定位
Low-Fidelity End-to-End Video Encoder Pre-training for Temporal Action Localization
Mengmeng Xu, Juan-Manuel Perez-Rua, Xiatian Zhu, Bernard Ghanem, Brais Martinez
TL;DR提出了一种新的 LoFi 视频编码器预训练方法,通过减少时空或时空分辨率的 mini-batch 组合来实现对编码器的端到端优化,有助于解决任务不一致性问题并提供更有效的特征表示,从而显著提高了现有 TAL 方法的性能。