BriefGPT.xyz
Ask
alpha
关键词
massively multilingual
搜索结果 - 3
COLING
HumanEval-XL:一种面向跨语言自然语言通用性的多语言代码生成评估基准
使用人工评估的大规模多语言代码生成基准,填补了在多语言代码生成领域中评估自然语言泛化能力的空白。
PDF
4 months ago
EMNLP
跨媒体 - 3600:一款大规模多语言多模态评估数据集
本文提出了 Crossmodal-3600 数据集,其中包含 3600 张图片,涵盖了 36 种语言中所使用的地区,并使用人工参考标题对其进行了注释。该数据集被应用于大规模多语言图片字幕模型的选择,并在使用 XM3600 作为自动度量的黄金
→
PDF
2 years ago
使用 ByT5 模型进行大规模多语言字素到音素转换
使用 ByT5 模型,我们从不同来源中整理出覆盖 100 种语言的 G2P 数据集,并训练了大规模的多语种 G2P 模型。与单语模型相比,多语种 ByT5 模型通过同时学习多种语言降低了电话错误率,可进一步通过无监督预测或微调,帮助低资源语
→
PDF
2 years ago
Prev
Next