Sep, 2023

VDialogUE: 一个统一的可视对话评估基准

TL;DR提出了 VDialogUE 基准测试,定义了五个核心多模态对话任务,并提出了一种综合评估模型性能的新评估指标 VDscore,同时介绍了一种名为 VISIT 的基准模型,该模型通过两阶段的预训练策略逐步构建多模态基础和对话能力,以促进通用多模态对话系统的发展。