Mar, 2024

通过潜在扩散模型探索上下文分割

TL;DR通过使用代表性的生成模型 —— 潜在扩散模型(LDM),我们从新的角度探索了上下文分割问题,提出了两种元架构和相应的输出对齐和优化策略。我们通过全面的消融研究发现,分割质量取决于输出对齐和上下文指令。实验证明,我们的方法在挑战性的上下文分割任务中取得了与专业模型或视觉基础模型相当甚至更强的结果,证明了潜在扩散模型也可以达到足够好的效果。