Mar, 2024

PLOT-TAL -- 基于优化输运的少样本时序动作定位的提示学习

TL;DR本论文介绍了一种新颖的少样本学习中的时间动作定位 (TAL) 方法,通过在实际视频中泛化不同情境的能力来解决常规单提示学习方法存在的过拟合问题。采用多提示学习框架,增强了每个动作的一组多样化提示,更有效地捕捉通用特征并减少过拟合风险。此外,利用最优输运理论,高效地将这些提示与动作特征对齐,优化了适应视频数据多方面特性的综合表示。实验证明了我们提出的多提示最优输运方法在 THUMOS-14 和 EpicKitchens100 的标准数据集上能够显著提高少样本 TAL 方法的定位准确性和鲁棒性,突出了其有效性。