Jul, 2021

多语言词嵌入去偏见:以印度三种语言为案例研究

TL;DR该论文提出了一种改进的去偏置单语词嵌入方法,以便于能够在跨语言情境下得到良好泛化,通过考虑不同的偏置量化方法以及单 / 多语言情境下不同的去偏置方法,证明了去偏置方法在下游 NLP 应用中的重要性。作者提出的方法在英语以及印地语、孟加拉语和泰卢固语三种印度语言的多语言嵌入中建立了最先进的效果,这将为基于词嵌入的不偏执下游 NLP 应用程序的创建打开新机遇。