Nov, 2022

多功能扩散模型:文字、图像和变体都在一个模型中

TL;DR本研究扩展现有单流程扩散管线到多任务多模态网络,通过可共享、可交换的多流程跨模式模块,将文本到图像、图像到文本等多流和变异处理统一在一个模型中,实现了风格和语义的解耦、双重和多重上下文混合等并发处理。实验证明,该框架性能优越,可启发基于扩散的通用人工智能研究。