Apr, 2023

MH-DETR: 跨模态变换器进行视频片段和精华片段检测

TL;DR提出了面向视频时刻和精彩片段检测的 MH-DETR 模型,其采用简单而高效的池化操作和跨模态交互模块,以获得更好的时序内模态上下文和跨模态特征。在多个数据集上的实验结果表明,MH-DETR 优于现有的最先进方法,具有较高的准确性和鲁棒性。