Sep, 2022
MUG: 用户界面上的交互式多模态基础
MUG: Interactive Multimodal Grounding on User Interfaces
Tao Li, Gang Li, Jingjie Zheng, Purple Wang, Yang Li
TL;DR针对多模态界面对话交互中的语言歧义问题,本文提出了一种新的交互式任务 MUG,并构建了一个包含 77820 组人类用户和智能 Agent 交互的实验数据集,通过离线和在线策略进行评估,实验结果表明允许迭代式交互可以显著提高任务完成率。