Jul, 2018

语音与人脸跨模态匹配的不相交映射网络

TL;DR提出了一种新的框架,称为 Disjoint Mapping Network (DIMNet),用于跨模态生物识别匹配,特别是声音和面部。DIMNet 通过将它们分别映射到它们的共同协变量,学习了不同模态的共享表示,从而找到模态之间的对应关系,并且证明了 DIMNet 能够比其他现有方法具有更好的性能,而且在概念上更简单且不需要过多的数据。