Apr, 2024

使用扩散模型揭示文本 - 图像不一致性

TL;DR为了解决在线误导信息的问题,该研究引入了 D-TIIL(基于扩散的文本 - 图像不一致性定位),采用文本对图像扩散模型来定位文本和图像对中的语义不一致性,并通过文本嵌入和修改后的图像区域进行可视化。