Nov, 2023

复杂视觉语言推理任务中的思维链路作用

TL;DR该研究通过将复杂的视觉语言任务拆分为子任务和中间步骤的思维链方法,探究其在提高需要复杂感知和推理的视觉语言任务中的有效性。我们提出了“先描述再决策”的策略,该策略受人类信号处理方式启发,显著提高探索任务性能50%,为进一步研究复杂视觉语言任务中的推理范式奠定了基础。