MMApr, 2020

文本引导神经图像修复

TL;DR本文提出一种名为 TDANet 的图像修复模型,其通过文本的描述信息和图像的辅助区域来确定修复区的语义内容,利用双模态注意机制提取出明确的语义信息并应用图像与文本匹配损失,其结果表明,在两个公开数据集上,TDANet 模型在定量和定性评测中均达到了新的最佳水平,并且生成的图像与文本描述一致。