Jul, 2024

双提示问题提问:具备回答感知性和区域参考的视觉问题生成

TL;DR利用双提示-答案和视觉兴趣区域,以及动态图和图序列模型进行视觉问题生成的研究。