BriefGPT.xyz
大模型
Ask
alpha
关键词
corpus quality
搜索结果 - 2
面向多语言大语言模型的平行语料利用方法
通过对平行语料库进行优化,可以提高多语言大型语言模型的性能,研究结果表明,过滤嘈杂的翻译是有效利用平行语料库的关键。
PDF
5 days ago
ACL
一瞥即知质量:对多语言网络爬虫数据集的审计
本文主要旨在探究如何评估及提高多语料库的质量,并针对少资源语言建议相关技术,同时也讨论低质量数据发布所可能带来的潜在风险。
PDF
3 years ago
Prev
Next