Mar, 2024
流式多扩散:基于区域的语义控制下的实时交互生成
StreamMultiDiffusion: Real-Time Interactive Generation with Region-Based Semantic Control
Jaerin Lee, Daniel Sungho Jung, Kanggeon Lee, Kyoung Mu Lee
TL;DR通过稳定快速推理技术和重构模型为新提出的多提示流批处理架构,我们提出了 StreamMultiDiffusion,这是第一个基于区域的实时文本到图像生成框架,在单个 RTX 2080 Ti GPU 上实现了 1.57 FPS 的区域文本到图像合成生成速度,比现有解决方案快 10 倍。