Nov, 2018

语音和图像的多模态单样本学习

TL;DR研究机器人如何通过视觉和语音标签来学习多模态单样本匹配任务,并且提出了几种基线和高级模型,最后通过在配对的语音和视觉数字数据集上进行实验说明了 Siamese 卷积神经网络在 11 种跨模态匹配方面的卓越性能。