BriefGPT.xyz
大模型
Ask
alpha
关键词
pre-trained lms
搜索结果 - 3
IndicXNLI: 评估印度语言的多语言推理
本文介绍了 IndicXNLI,一个 NLI 数据集,用于 11 种印度语言的跨语言转移技术的分析,研究了不同的预训练模型、语言、多语言和混合语言输入等因素对预训练模型的行为的影响。
PDF
2 years ago
EMNLP
噪声排除:测试预训练语言模型信息处理的鲁棒性
本研究通过让模型处理带有分散注意力内容的填空任务,检验了预训练语言模型利用关键上下文信息的能力;研究结果表明,模型往往只是依靠表面上与上下文有关的信息进行预测,而对于上下文语境的理解能力不及预期。
PDF
3 years ago
ACL
通过微调平行语料库中的嵌入来进行单词对齐
该论文探讨了一种嫁接预训练语言模型和平行文本的方法来提高单词对齐质量的方法,提出了从这些微调模型中有效提取对齐信息的新方法,并证明了它们在五种语言对上优于之前的最先进模型,还演示了开源的具备预训练模型的 AWESOME 单词嵌入式多语言编码
→
PDF
3 years ago
Prev
Next