AAAIDec, 2021
使用预训练单模型进行 SIMMC 2.0 的多模态交互
Multimodal Interactions Using Pretrained Unimodal Models for SIMMC 2.0
Joosung Lee, Kijong Han
TL;DR本文介绍了我们在 Dialog State Tracking Challenge 10 上进行的 Situated Interactive MultiModal Conversations 2.0 挑战中的工作和方法,提出了一种结合图像和文本的多模态模型,并对 SIMMC 2.0 数据集进行了挑战。通过预先训练模型,我们在 subtask#1,#2 中取得了第三佳表现,并在生成 subtask#4 中获得亚军。