Jul, 2024

XferBench: 一种基于数据的紧迫语言基准

TL;DR我们引入了一个用于评估利用数据驱动方法检验新兴语言整体质量的基准,并使用深度学习框架将新兴语言与人类语言的相似性作为其 "质量" 的概念进行解释。通过将新兴语言用作深度学习下游自然语言处理任务的预训练数据,我们通过衡量下游性能来衡量新兴语言的质量。我们将此基准实现为一个易于使用的 Python 包,只需要一个新兴语言表达的文本文件进行评估。最后,我们通过使用人类、合成和新兴语言基准来经验性地测试该基准的有效性。