Sep, 2023
VDialogUE: 一个统一的可视对话评估基准
VDialogUE: A Unified Evaluation Benchmark for Visually-grounded Dialogue
Yunshui Li, Binyuan Hui, Zhaochao Yin, Wanwei He, Run Luo...
TL;DR提出了 VDialogUE 基准测试,定义了五个核心多模态对话任务,并提出了一种综合评估模型性能的新评估指标 VDscore,同时介绍了一种名为 VISIT 的基准模型,该模型通过两阶段的预训练策略逐步构建多模态基础和对话能力,以促进通用多模态对话系统的发展。