BriefGPT.xyz
大模型
Ask
alpha
关键词
vocabulary adaptation
搜索结果 - 4
令牌化对 LLaMa 俄文适应性的影响
通过词汇替换来解决 LLaMa 俄语适应问题,提高模型质量并加速微调和推理,同时减少内存消耗。
PDF
7 months ago
面向用户查询的上下文多语言拼写检查器
该论文介绍了一种多语种的拼写检查器,它可以根据特定产品的需求适应其词汇,并在领域特定的数据集上性能优异,可以用于搜索和为各种应用程序提供自动完成功能。
PDF
a year ago
EMNLP
IndoBERTweet:印度尼西亚推特预训练语言模型,具有效领域特定词汇初始化
本研究介绍了 IndoBERTweet,这是第一个大规模预训练的印度尼西亚语 Twitter 模型,它通过扩展单语训练的印度尼西亚 BERT 模型来训练,并使用了特定领域的词汇表。我们特别关注词汇不匹配下的有效模型适应性,并基准测试了不同的
→
PDF
3 years ago
ACL
通过词汇替换实现多语言机器翻译的连续学习
本研究提出了一种简单的词汇适应方案,以扩大多语言机器翻译模型的语言容量,为多语言机器翻译的高效连续学习铺平了道路。我们的方法适用于大规模数据集,适用于未见过脚本的远程语言,在原始语言对的翻译性能上只有轻微的降低,在仅拥有新语言的单语数据的情
→
PDF
3 years ago
Prev
Next