ACLFeb, 2023

坐标对话中的多模态物体识别

TL;DR通过探索三种方法并在 SIMMC 2.1 数据集上进行评估,我们提出了一种最有效的方法 —— 场景对话对齐,相较于 SIMMC 2.1 基准提升了约 20% 的 F1 分数。我们还分析和讨论了该方法的局限性以及未来研究的潜在方向。