Sep, 2021

WhyAct: 生活视频中的行动原因识别

TL;DR本文介绍一种利用视频和文本信息来自动识别在线视频中人类行为原因的多模态模型,并基于手动注释数据集WhyAct,研究了流行的生活方式视频类型。