BriefGPT.xyz
大模型
Ask
alpha
关键词
subword-level
搜索结果 - 2
重新思考分词:为大型语言模型打造更好的分词器
通过追踪分词器从词级到子词级的演变,本研究分析了分词器如何在增强模型适应性的同时控制复杂度方面平衡标记和类型。根据认知科学中的 “最省力原则”,本文提出了一种新的 LLN 分词器 LiB 模型,它可以自主学习由子词、词和多词表达式组成的综合
→
PDF
4 months ago
ACL
基于子词的语言识别技术用于单词内的语码转换
本文将语种识别任务推广到子词级别,研究如何识别包含两种以上语言的语素(intra-word CS),提出了一种基于分段循环神经网络的模型,并在西班牙 - 韦萨里卡数据集和德国 - 土耳其数据集的实验中,相较于基准方法有略微提升或相当的表现。
PDF
5 years ago
Prev
Next