BriefGPT.xyz
大模型
Ask
alpha
关键词
underrepresented languages
搜索结果 - 4
ACL
ByteT5 在代表性较弱的语言的《圣经》文本多语言翻译中的效果
本研究提出了一种基于 ByteT5 的多语言翻译模型,旨在将圣经翻译成少数语言。通过使用约翰・霍普金斯大学圣经语料库进行训练,我们使模型能够捕捉基于字符和形态丰富的语言的复杂细微差别。我们的结果通过 BLEU 分数和样本翻译进行衡量,表明该
→
PDF
a month ago
仇恨言论管控的最新进展:多模态和大模型的作用
在在线交流的不断演变中,如何进行仇恨言论的管理成为一个复杂的挑战,而数字内容的多模态性质进一步加大了这一挑战。本综述全面调查了仇恨言论管理的最新进展,着重介绍了大型语言模型(LLMs)和大型多模态模型(LMMs)在其中的重要作用。通过对当前
→
PDF
5 months ago
NusaWrites:为代表性和极度资源匮乏的语言构建高质量语料库
对印尼本土语言进行案例研究的结果表明,原生说话者通过段落撰写所生成的数据集在词汇多样性和文化内容方面优质,有助于推广自然语言处理技术到较少研究的语言领域。
PDF
9 months ago
ACL
一个国家,700 + 种语言:印度尼西亚少数语言与方言的 NLP 挑战
该研究提供了关于印度尼西亚 700 多种语言的 NLP 研究现状的概述,突出了印尼 NLP 面临的挑战以及这些挑战如何影响当前 NLP 系统的性能。最后,我们提供一些推荐来发展印尼和其他语言的 NLP 技术。
PDF
2 years ago
Prev
Next