BriefGPT.xyz
Ask
alpha
关键词
less-resourced languages
搜索结果 - 4
优化多语言大型语言模型的语言增强:以韩文为例的案例研究
本研究提出了三种策略以增强不太具备资源的语言在大型语言模型中的表现:扩展词汇表、使用双语数据进行预训练以对齐高资源语言和低资源语言、构建高质量的小规模指令数据集并进行指令微调。通过对比八个任务的其他大型语言模型,在质量分析中,我们的提出的
→
PDF
4 months ago
基于 Transformer 的生物医学语言模型的领域内适应性本地化
本文旨在探究两种途径从英语语料库中翻译生成的语言格式数据和本地化的语料库数据来建立生物医学语言模型,以应用在医疗领域中以提高患者护理和管理(本研究以意大利为例)。通过实验发现,在相对较小的语料库情况下,高质量数据的合并可以提高模型性能,但数
→
PDF
2 years ago
EMNLP
开放韩国语料库:实用报告
本文介绍了韩语语料库的资源开发、开放数据集以及为促进低资源语言的研究提出了开源数据集的构建和发布方向。
PDF
4 years ago
EMNLP
利用形态和音位子单元表示将词嵌入适应新语言
使用语言学驱动的子词单元:音素、词素和字形,提高低资源语言下的自然语言处理、实体名称识别和机器翻译表现。
PDF
6 years ago
Prev
Next