Jan, 2021

基于解耦式编码-解码网络的视觉-语言预训练中的定时采样

TL;DR本文提出了一种两流解耦设计的编码器-解码器架构,使用预训练的编码器-解码器结构进行同时视觉语言理解和生成预训练,使用预训练策略优化编码器和解码器,具有良好的泛化性能。