Sep, 2023

探索稀疏 Mixture of Experts 在基于文本的图像合成中的应用

TL;DRAurora 是一种基于 GAN 的文本到图像生成器,利用一组专家进行特征处理学习,并使用稀疏路由器来选择每个特征点最合适的专家,以实现对采样随机性和文本条件的忠实解码,该模型在 64x64 图像分辨率下,使用 LAION2B-en 和 COYO-700M 数据集进行训练,在 MS COCO 上达到了 6.2 的零样本 FID 指标。