Jun, 2019

多模态不对齐语言序列的多模态转换器

TL;DR该研究介绍了一种称为 MulT 的多模态转换器,利用方向性一对一跨模态注意力在不显式对齐数据的情况下,通用地解决了模型多模态人类语言时序数据中的两个主要挑战,即内在数据非对准性和跨模态元素之间的长程依赖关系。