Jul, 2022

以交互为预训练的地面功能表示学习

TL;DR借助神经网络建模物体状态,可以实现有效的物体功能信息提取并与传统语义学模型相结合,能够在基于图像的语言学习上取得更好的表现。