Jun, 2024

EMMA: 您的文本到图像扩散模型可秘密接受多模态提示

TL;DREMMA 是一个创新的图像生成模型,通过多模态特征连接器设计将文本与其他模态信息有效地整合,以实现个性化和情境感知图像和视频的生成。EMMA 模块的学习和组装使其成为一种灵活且有效的解决方案,用于高保真度和详细程度较高的多模态条件图像生成任务。