Jul, 2021

HinGE:一份用于生成和评估代码混合 Hinglish 文本的数据集

TL;DR该论文介绍了一种生成用于混合语言的数据集 HinGE,旨在解决在多语言混合文本和语音中对生成文本进行评估的不足,并证明常用的评估度量标准在混合文本数据上的无效性。该数据集有助于混合语言的自然语言生成研究的进展。