Feb, 2024

自动化声音变化预测用于系统演化推测:图卡诺亚人案例研究

TL;DR我们描述了一套新的方法来部分自动化语言系谱推断,给出了包括词族集、特定原型和音变的声音法则的映射,以及声音变化的语言类型学数据库。通过在这些声音变化数据上训练神经网络,我们取代了语言学专家在基于最简方案的语言系谱推断算法中的部分工作,从而加权不同声音之间的发音差距,并预测历史上原型和现代后代之间的中间声音变化步骤。在对图卡诺安语言进行的最佳实验中,该方法生成了一棵 Generalized Quartet Distance 为 0.12 的树,高于其他半自动化基线。我们讨论了我们的神经网络方法和基于最简方案的树预测的潜在优势和劣势。我们还尝试了一种最小概括学习器来自动引导音变法则,发现其效果与专家注释的声音法则相当有效。我们的代码可在此 https URL 上公开获取。