Jul, 2024

对话可视化:通过大型语言模型实现通过对话理解提升图像选择

TL;DR通过利用大型语言模型的强大推理能力生成精确的与对话相关的视觉描述符,我们提出了一种新的方法,以实现与图像的无缝连接,并在对话-图像检索性能方面取得了显著的改进。