Jun, 2023

通过叙述学习将说明文章与视频联系起来

TL;DR本文提出了一种无需手动监督的方法来将『如何做』视频中的步骤与 wikiHow 等语言知识库中的指导文章进行对齐,并采用多模态对齐进行全局时间定位,验证结果表明与现有方法相比具有明显优势。