Jul, 2020

使用拉丁字母编写的南亚语言处理:Dakshina 数据集

TL;DR该论文介绍了 Dakshina 数据集,包含 12 种南亚语言的拉丁文和本地脚本文本、罗马化词典和全句平行数据,并提供了基于该数据集的单词音译、全句音译和语言建模的基线结果。