Sep, 2023

深度神经网络和双向动态时间扭曲算法的半监督三维视频信息检索

TL;DR该论文提出了一种新颖的半监督深度学习算法,用于基于视觉内容检索相似的 2D 和 3D 视频。该算法采用深度卷积和递归神经网络与动态时间扭曲作为相似性度量,能够处理大规模视频数据集,并根据图形帧和内容检索与给定查询视频片段最相关的视频。该方法在包括 CC_WEB_VIDEO、Youtube-8m、S3DIS 和 Synthia 等多个公共数据集上进行了测试,与最先进的方法相比表现良好。该算法有效地解决了视频检索任务,并优于基准深度学习模型。