ICMLDec, 2023

儿童视频内容的视觉语言模型用于内容管理的潜力

TL;DR该研究通过评估多种 CLIP 变种模型在儿童动画视频内容管理中的性能,展示了 Vanilla CLIP with Projection Layer 模型在提供更多上下文环境的内容管理提示方面优于以往工作的结果。研究结果表明,在内容管理提示中加入更多上下文对于卡通视频是必要的,因为它们在 CLIP 训练数据中的表示不足。