Apr, 2024

以意图为条件的注视导向图神经网络用于动作预测

TL;DR通过将人类凝视引入计算算法,我们提出了一种基于视觉 - 语义图的 “凝视引导行为预测” 算法,利用图神经网络识别行为者的意图并预测行为序列以达到该意图,并通过收集包含人类凝视数据的 VirtualHome 环境中生成的家庭活动数据集,在 18 类意图识别的准确性上实现了 7% 的改进,凸显了我们方法从人类凝视数据中学习重要特征的效果。