Jun, 2023

Jambu 南亚语言历史语言数据库

TL;DRJambu 是一个统一了许多之前资源的、结构化和易于获取的南亚语言同源数据库,它包含来自 602 个方言的 287,000 个词元,这些词元分成了 23,000 个同源集。我们概述了必要的数据处理方法,并针对数据的印度 - 雅利安子集训练了反射预测的神经模型。我们希望 Jambu 成为所有历史语言学家和印度学家的宝贵资源,并期待进一步改进和扩展数据库。