Jul, 2021

OPT: Omni-Perception Pre-Trainer 用于跨模态理解和生成

TL;DR本文提出了一种跨模态的全视觉感知预训练器,其采用了多任务预训练策略从不同数据粒度学习了对图片、文字和音频的跨模态理解与生成。