Dec, 2024

基于长度感知的DETR模型用于鲁棒时刻检索

TL;DR本研究针对视频时刻检索中的短时刻定位问题,提出了MomentMix和长度感知解码器,显著增强了短时刻的特征表示及其中心位置预测。实验证明,该方法在多个基准数据集上超越了现有的DETR模型,特别是在短时刻的定位上表现突出,具有重要的实际应用潜力。