BriefGPT.xyz
大模型
Ask
alpha
关键词
machine translation training
搜索结果 - 1
COLING
一种新的大规模多语言数据集用于高性能语言技术
我们介绍了 HPLT(高性能语言技术)语言资源,这是一个包括来自 CommonCrawl 和互联网档案的先前未使用的网络爬取的单语和双语语料库的大规模多语言数据集。我们描述了我们采集、管理和处理大型语料库的方法,这些方法依赖于开源软件工具和
→
PDF
3 months ago
Prev
Next