BriefGPT.xyz
Ask
alpha
关键词
language modeling performance
搜索结果 - 4
Toucan: 基于标记的字符级语言建模
通过学习将字符表示组合成标记的方式,我们提出了 Toucan,它是一种改进的字符级模型,使其更具 “标记感知” 能力。与先前的方法相比,我们的方法在字符生成方面显著加快速度,同时保持了语言建模性能。我们还探索了学习到的字符序列的动态标记化与
→
PDF
8 months ago
多语种模型用于 200 多种高低资源语言的研究
添加多语言数据可以提高低资源语言模型的性能,但对于高资源语言而言,添加多语言数据可能会降低性能。
PDF
8 months ago
大型语言模型隐式学习将神经句子轨迹纠正为自然语言的预测性表示
用于预测的自回归变换器的预测表示通过逐渐变得更加直线化来实现更好的语言建模性能,并与句子的惊异程度之间存在一致的关系。
PDF
8 months ago
EMO: 自回归语言建模的地球移动距离优化
神经语言模型是人类文本的概率模型,主要使用最大似然估计进行训练。本文提出了基于 EMD 优化的自回归语言建模方法,通过对 EMD 的上界估计实现了端到端训练,并在广泛评估中表现出了比 MLE 更好的语言建模性能。此外,EMO 还能在仅微调
→
PDF
9 months ago
Prev
Next