COLINGJun, 2024

意大利语言变体的语音分析

TL;DR通过利用自我监督学习模型,本研究自动识别意大利不同语言方言的语音样本的地理来源,分析区域语言之间的差异和相似性,揭示这些多样而又密切相关方言之间的关系并对其演化和区域发展进行理解。通过评估多种监督对比学习目标作为预训练和额外的微调目标,实验证明预训练的自我监督模型能够有效地识别语音录制的地区,并结合对比学习在微调中创造出能够明确分开各个区域语言方言的嵌入,展示了结合自我监督预训练和对比学习对于这一任务的价值。