May, 2023
MMoT: 混合模态词元变换器用于组合多模态条件图像合成
MMoT: Mixture-of-Modality-Tokens Transformer for Composed Multimodal Conditional Image Synthesis
Jianbin Zheng, Daqing Liu, Chaoyue Wang, Minghui Hu, Zuopeng Yang...
TL;DR提出了一种基于混合多模态令牌变换器的组合多模态条件图像合成技术,解决了多模态控制信号协调问题和不平衡问题,实现了在复杂多模态条件下的高质量和忠实的图像合成。