主题相关视频的协作摘要
本文提出了一种无监督的视频多维摘要的方法,使用新颖的多样性感知稀疏优化方法探索了视频之间的互补性,提出了一个能够全面描述整个视频集合的多角度摘要,并且在新的 Tour20 数据集和其他多视图数据集上表现优异,并超越了目前最先进的方法。
Jun, 2017
视频摘要是一个至关重要的研究领域,旨在从当今海量视频内容中高效浏览和检索相关信息。尽管视频摘要的重要性,缺乏多样化和有代表性的数据集阻碍了算法的全面评估和基准测试。为了克服数据稀缺的挑战并改进评估,我们提出了一种利用视频数据结构和信息生成信息摘要的无监督方法。此外,我们还引入了一种专门用于视频摘要的创新评估流程。实验结果表明,我们的无需训练的框架优于现有的无监督方法,并与最先进的监督方法取得竞争性结果。
Apr, 2024
本研究提出了一种新的视频摘要方法,即根据用户关注的特定视频方面来生成摘要。通过使用聚类技术来确定视频的语义相似性并减少冗余性,同时提高多组视频的摘要的多样性,本文提出了一种基于 Fisher 判别准则的摘要选择方法,并使用自制数据集对其进行了定量和定性实验证明了该摘要方法的有效性。
Apr, 2018
该论文将视频摘要提出了内容为基础的推荐问题,使用可扩展的深度神经网络在显式建模的片段和视频上进行预测,通过场景和动作识别来寻找视频理解任务不同方面之间的相关性,同时讨论音频和视觉特征在总结任务中的影响,并通过数据增强和多任务学习来防止模型过度拟合。该模型最终在 ICCV 2019 CoView Workshop Challenge Track 中获得第一名。
Oct, 2019
该论文提出了一种基于深度视频特征和聚类的视频摘要技术,旨在更高效地生成互联网视频的概览,该技术通过设计一种映射视频和描述的深度神经网络来将视频元素转化为语义空间。
Sep, 2016
本文提出了通过结合多种特征源进行特征融合的视频摘要算法,该算法在两个基准测试数据集 TVSum 和 SumMe 上取得了最新的研究结果,并对以往的研究方法进行了评估,同时进行误差分析以找出导致分类错误的因素。
May, 2021
介绍一种通过联合嵌入和稀疏代表选择的新颖无监督框架来总结多视角视频,该方法能够提取出多视角视频之间的复杂内部和外部关联,实现高效准确的摘要生成。
Jun, 2017
本文使用伪摘要的方法,提出了一种结合上下文感知时态视频编码器和片段评分转换器的教学视频摘要网络,并将其应用于 WikiHow Summaries 数据集。结果表明,该模型在教学视频摘要方面显著优于各基准和最先进的视频摘要模型。
Aug, 2022
该研究利用神经网络诱导的文本视觉语义嵌入空间,将查询相关汇总作为视频帧子集选择问题进行提出,该方法在多个方面优于先前的技术,并引入具有多样性和查询特定相关性标签的新数据集进行模型训练和测试。
May, 2017
本文提出了一种基于监督的视频摘要方法,该方法利用人类创建的摘要来进行关键帧的视频摘要,同时实现了基于语义信息的子镜头摘要,既降低了计算成本,还提供了定义跨越数帧的子镜头的视觉相似性的更灵活方式。在多项基准测试中进行了广泛评估,并在几个场景中胜过现有方法。
Mar, 2016