BriefGPT.xyz
Ask
alpha
关键词
morpheme-aware subword tokenization
搜索结果 - 1
通过语言学信息的次词单位分词和次字符分解来提升韩文 NLP 任务
我们介绍了一种考虑词素的子词切分方法,利用字符的分解方法来解决字节对编码(BPE)在韩语中应用所面临的挑战,韩语的特点是丰富的语态和独特的书写系统。我们的方法在预训练语言模型(PLMs)中平衡了语言准确性和计算效率。我们的评估结果显示,该技
→
PDF
8 months ago
Prev
Next