Jan, 2024

多模式学习:通过顺序阅读未修剪视频实现动作识别

TL;DR提出了一种通过从未修剪的视频中顺序提取视频片段来聚合多个模型的学习视频的新方法。实验结果表明,与无同步相比,该方法改善了性能。