Jun, 2022

niksss at HinglishEval:基于 BERT 的通用语境嵌入与 Catboost 用于低资源合成跨语混合 Hinglish 文本的质量评估

TL;DR该论文描述了 INLG 2022 HinglishEval 挑战的系统描述。该挑战旨在研究影响混合代码文本生成系统质量的因素。任务分为两个子任务,即合成 Hinglish 数据集的质量评级预测和注释者不一致预测。我们尝试使用句子级嵌入解决这些任务,这是通过对我们文本中所有输入标记的上下文化词嵌入进行平均池化获得的。我们在产生各自任务的嵌入上尝试了各种分类器。我们最有效的系统在子任务 B 上排名第一,在子任务 A 上排名第三。