EMNLPNov, 2022
跨语言数据集构建与必要资源的综述
Beyond Counting Datasets: A Survey of Multilingual Dataset Construction and Necessary Resources
Xinyan Velocity Yu, Akari Asai, Trina Chatterjee, Junjie Hu, Eunsol Choi
TL;DR该研究旨在量化语言资源之间的不平等性,并提出一些方法来改善低资源语言的数据收集,以促进未来的多语言数据发展。