MMJul, 2023
DCTM:对话中多模式参与估计的扩张卷积变换模型
DCTM: Dilated Convolutional Transformer Model for Multimodal Engagement Estimation in Conversation
Vu Ngoc Tu, Van Thong Huynh, Hyung-Jeong Yang, M. Zaigham Zaheer, Shah Nawaz...
TL;DR我们提出了一种膨胀卷积变换器,用于在 MULTIMEDIATE 2023 竞赛中建模和估计人类参与度,相比基线模型,在测试集上有 7% 的显著提升,验证集上有 4% 的提升,并证明对于这类数据,简单的拼接方法和自注意力融合可以得到最佳性能。