Mar, 2024

长篇电视新闻节目视频的多模态分章

TL;DR我们提出了一种自动化分章节的电视新闻节目视频的新方法,通过冻结神经网络和训练的LSTM网络,集成了音频和视觉线索来准确生成节目片段边界,并在500多个电视新闻节目视频的多样数据集上进行了评估,结果表明这种创新的融合策略达到了最新性能,较高的精度率为82%的IoU。因此,这种方法显著提升了电视新闻节目档案的分析、索引和存储能力,为大规模音视频资源的高效管理和利用铺平了道路。