Jun, 2024

可微分任务图学习:程序化活动表示和基于自我感知视频的在线错误检测

TL;DR通过最大似然优化边权重的方法,从动作序列中预测任务图,与之前的方法相比提高了 16.7% 的准确性;同时可通过文本或视频嵌入来预测任务图,并在程序性自我中心视频中显著提高在线错误检测的准确性,分别在 Assembly101 和 EPIC-Tent 数据集上获得了 19.8% 和 7.5% 的显著增益。