COLINGMar, 2024

CLEVR-POC:部分可观察环境下的推理密集型视觉问答

TL;DRCLEVR-POC 是一个基于部分可观察环境下的逻辑约束的推理密集型视觉问答基准,通过集成 GPT-4 大型语言模型、视觉感知网络和形式逻辑推理器,展示了在可用且至关重要的环境特定背景知识下实现卓越性能的神经符号模型。