Jun, 2023
通过叙述学习将说明文章与视频联系起来
Learning to Ground Instructional Articles in Videos through Narrations
Effrosyni Mavroudi, Triantafyllos Afouras, Lorenzo Torresani
TL;DR本文提出了一种无需手动监督的方法来将『如何做』视频中的步骤与 wikiHow 等语言知识库中的指导文章进行对齐,并采用多模态对齐进行全局时间定位,验证结果表明与现有方法相比具有明显优势。