NIPSDec, 2014

多模态转移深度学习及其在音视频识别中的应用

TL;DR这篇论文提出了一种转移学习框架,能将单一模态神经网络的知识迁移到另一个模态的网络上,通过语音数据微调已经训练过的视频识别网络,该方法首先学习抽象表示层中每个网络的类比映射,然后应用神经网络操作进行目标网络的微调,同时保持其拓扑不变,该框架能灵活地适用于任何多模态数据集或已存在的共享基础语义的深度网络。