Jun, 2017

学习所有模型的一种模型

TL;DR本研究旨在通过建立一个深度学习模型,同时训练图像分类、多语种翻译、图片描述生成、语音识别以及英文解析等多个任务,并在各个任务上都达到良好的结果。该模型特别之处在于将多个计算块集成到架构中,如卷积层、注意力机制和稀疏门控层等,每个计算块都对一部分任务至关重要,但即使对于不是关键任务的块,也不会影响其它任务的表现。同时,该研究还发现,少样本的任务集成到多个任务进行训练将会有较大提升。