Mar, 2024

流式多扩散:基于区域的语义控制下的实时交互生成

TL;DR通过稳定快速推理技术和重构模型为新提出的多提示流批处理架构,我们提出了 StreamMultiDiffusion,这是第一个基于区域的实时文本到图像生成框架,在单个 RTX 2080 Ti GPU 上实现了 1.57 FPS 的区域文本到图像合成生成速度,比现有解决方案快 10 倍。