COLINGMar, 2024

多语言对话转换预测基于语音活动投影

TL;DR研究报告通过使用音频活动预测模型,在多语言数据中进行了口语对话研究,并对单语和多语模型进行了比较分析,发现多语模型对所有语言的预测表现与单语模型相当,同时还分析了声调敏感性和两种不同的音频编码器。