Sep, 2023

COMEDIAN:自我监督学习与知识蒸馏在使用Transformers进行动作定位中的应用

TL;DR我们提出了COMEDIAN,这是一种新颖的用于动作检测的时空变换器初始化流程,其中包括自监督学习和知识蒸馏。通过三个步骤和两个初始化阶段,我们的流程实现了时间戳级别的动作检测任务。实验表明,我们的预训练模式具有卓越的性能和快速收敛,相比未经预训练的模型,我们的预训练流程具有改进的性能和更快的收敛速度。