建立巴西土著语言学习游戏:一个案例研究
通过和计算机交互完成任务,以语言游戏的方式,人类可以在不知道什么是语言的情况下学习语言,为建立自适应的自然语言接口打下基础,使用组合性而避免使用同义词有助于任务表现,从零开始快速学习语义解析模型,并进一步加速的学习计算机策略,以适应成功的玩家。
Jun, 2016
本文介绍了一种用于已濒危语言 ——Kakataibo 建立 Universal Dependencies treebank 的方法。作者采用合作式的方法,先讨论了此举的可行性,然后介绍了 treebank 的说明和特征,并对语料库进行了研究和实验,实现了词性标记和句法依存分析等功能。作者还探讨了 Shipibo-Konibo 语言表征对该树库的影响。
Jun, 2022
本文回顾了关于美洲土著语言的研究、数字资源和现有的自然语言处理(NLP)系统。并呼吁在像美洲一样语言丰富和多样的区域开展 NLP 研究,以解决诸如远离语言和资源匮乏等主要挑战和研究问题。
Jun, 2018
通过采访 17 位在澳大利亚从事或支持土著和 / 或托雷斯海峡岛民社区语言技术项目的研究人员,本文探讨了在为土著语言构建 NLP 技术时的伦理考虑,并建议 NLP 研究人员应关注与土著社区的互动过程,而不仅仅关注去语境的产物。
Feb, 2024
通过 Wikipedia 生成词汇测试,评估参与者的母语能力,可以在不同语言文化背景下了解文化、认知和语言的视角,通过六项行为实验测试结果表明,这个测试可以区分母语相近的语言,测试结果与现有测试成绩和个人报告结果有很强的相关性。
Feb, 2023
该论文聚焦于快速技术进步面前土著语言社区的边缘化问题,强调这些语言的文化丰富性以及它们在自然语言处理领域被忽视的风险。我们旨在弥合这些社区与研究人员之间的鸿沟,强调尊重土著社区观点的包容性技术进步的必要性。我们展示了拉丁美洲土著语言在自然语言处理方面的进展,以及涵盖拉丁美洲土著语言现状、它们在自然语言处理中的代表性,以及保护和发展它们所需要的挑战和创新的调查。该论文在理解拉丁美洲土著社区以及一般低资源土著社区的自然语言处理需求和进展方面对当前文献作出了贡献。
Apr, 2024
本文探讨了在进行机器翻译低语料资源的土著语言时所带来的伦理问题,调查了当地人对于自己语言机器翻译所需的伦理考虑,并得出了深入研究所需的原生社群成员参与度关键这一结论。
May, 2023
本篇研究尝试使用预训练的机器翻译模型进行从西班牙语到南美 10 种土著语言的翻译,相对于之前方法使用数据增强的手段,该方法在多种语言上取得了更好的效果。
May, 2022
通过三个原则和三种方式,讨论了 NLP 如何帮助挽救濒危语言,以 Cherokee 语言为案例研究,提出了丰富资源的两种方法,并与社区合作完成,同时介绍了一些兴趣工具。
Apr, 2022
语言技术是复杂而新兴的领域,通过多元化的设计理论及去殖民化新兴技术,可以在全球范围内实现语言技术的发展和多元化应用。
May, 2024