Nov, 2023

LEAP: LLM - 基于我为中心的行动程序生成

TL;DRLEAP 是一种通过使用大型语言模型(Large Language Model)生成视频相关行动程序的新方法,这些行动程序代表行动的动作、感知和结构方面,并包括子动作、前后条件和控制流。通过在 EPIC Kitchens 数据集的大部分训练集上应用 LEAP,并发布生成的行动程序,我们将 LEAP 作为辅助监督源,通过应用其行动程序对行动识别和预测网络施加的损失函数,我们在这两个任务上实现了显著的性能提升。截至 11 月 17 日,我们的方法在 EPIC Kitchens 行动识别排行榜上排名第一。