Oct, 2021

SLAM: 通过语音-文本联合预训练实现语音和语言建模的统一编码器

TL;DR将无监督预训练应用于语言理解,在语音和文本之间建立单一模型,包括BERT目标和w2v-BERT目标以及其他预训练技术改进,同时在GLUE任务中也取得了不俗的竞争力。