Aug, 2022

对比学习在低资源语言的双语文本挖掘中的应用

TL;DR本文介绍了一种针对低资源语言挖掘高质量双语数据的方法,即使用多负对比损失进行语言模型微调,可以获得更干净的双语数据,实验证明,在高棉语和普什图语等低资源语言数据挖掘方面,该方法明显优于以往的最先进方法。