Dec, 2023

减少幻觉:利用视觉语境增强洪水灾害损害评估的 VQA

TL;DR本论文提出了一种名为洪水灾害 VQA-TSP 的零样本视觉问答模型,通过两阶段提示生成思考过程并使用视觉上下文来减轻思考过程中的幻觉问题,实验结果显示我们的方法在洪水灾害场景中超过了现有零样本 VQA 模型的性能,为改进基于 CoT 的零样本 VQA 性能提供了研究基础。