Oct, 2023

InViG: 针对 500K 人机交互的交互式视觉锚定基准评估

TL;DR大规模的互动视觉消除歧义和接地数据集通过开放性目标导向的消歧对话提供了针对人机交互中的歧义性行为的实用且具有挑战性的评测基准。