ACLFeb, 2024

AccentFold:零点自适应目标口音的非洲口音之旅

TL;DR提出了 AccentFold 方法,通过利用学习到的口音嵌入之间的空间关系来提高自动语音识别(ASR)的性能,特别是在非洲口音的背景下。发现了 100 多种非洲口音之间的空间关系,强调了地理和谱系的相似性以及从语音中学到的一致的语音和形态学规律。通过实证评估,证明了 AccentFold 的有效性,对于未知分布的口音,基于 AccentFold 信息的训练样本提取优于强基准方法,相对字错误率(WER)改善了 4.6%。这一研究强调利用语言学关系来改善零样本 ASR 适应目标口音的潜力。