CVPRApr, 2023

AutoShot:短视频数据集和最新的镜头边缘检测技术

TL;DR本研究通过提取 853 个完整的短视频和 11,606 个镜头注释,利用新数据财富,提出了一种名为 AutoShot 的方法,通过在包含各种先进的 3D ConvNets 和 Transformer 的搜索空间中进行神经架构搜索来优化短视频镜头分割的模型设计,并在新构建的 SHOT 数据集上对该方法进行了推导和评估,实现了比先前最先进方法更高的 F1 分数,也在 ClipShots、BBC 和 RAI 数据集上获得了更好的表现。