ACLFeb, 2022

与小猪佩奇一起学英语

TL;DR通过对儿童动画片数据集的使用,研究利用视觉和语音数据在联合矢量空间中表示话语与视觉信息的双向架构,以解决该领域的研究中存在的数据训练不足的问题。