Mar, 2024
Edit3K: 视频编辑组件的通用表示学习
Edit3K: Universal Representation Learning for Video Editing Components
Xin Gu, Libo Zhang, Fan Chen, Longyin Wen, Yufei Wang...
TL;DR该研究聚焦于理解主要的视频制作流程,包括六种主要的编辑组件:视频效果、动画、过渡、滤镜、贴纸和文本。该论文介绍了第一个用于视频创作的大规模数据集,探索了编辑组件的视觉表示方法,并提出了一种新的学习方法,能够更好地学习与编辑组件相关的视觉特征。研究结果表明,该方法在编辑组件的检索和识别方面表现优于其他替代解决方案,并且在过渡推荐任务上取得了最先进的结果。