BriefGPT.xyz
Jun, 2022
LegoNN:构建模块化编码器-解码器模型
LegoNN: Building Modular Encoder-Decoder Models
HTML
PDF
Siddharth Dalmia, Dmytro Okhonko, Mike Lewis, Sergey Edunov, Shinji Watanabe...
TL;DR
描述了LegoNN过程,它通过重新使用decoder模块来构建encoder-decoder结构,从而实现在各种机器翻译和语音识别任务中的重复使用,同时引入了一种模态不可知编码器来提高其可移植性。实验证明LegoNN模型的有效性。
Abstract
State-of-the-art
encoder-decoder models
(e.g. for
machine translation
(MT) or
speech recognition
(ASR)) are constructed and trained end-to
→