BriefGPT.xyz
Ask
alpha
关键词
tokenization methods
搜索结果 - 3
ACL
重温次词标记化:大型语言模型中的词缀否定案例研究
本文旨在研究测量后缀否定对现代英语大型语言模型(LLMs)的影响。通过负性语素表达被否定的含义,这对 LLMs 来说可能会具有挑战性,因为它们的分词器往往不具备形态的可行性。通过使用不同的子词分词方法,我们进行了大量实验,得出了有关分词性能
→
PDF
3 months ago
HyperVQ: 基于 MLR 的双曲空间向量量化
利用超 bolic 空间进行向量量化 (HyperVQ),通过对比 VQVAE 中的欧几里得 K-Means 聚类,形成了超 bolic 多项式逻辑回归问题的 VQ 操作。通过广泛的实验,我们证明 hyperVQ 在重建和生成任务中的性能相
→
PDF
4 months ago
ICLR
尼日利亚皮钦语的监督和无监督神经机器翻译基线
研究实现了监督和无监督神经机器翻译模型来翻译英语和尼日利亚皮钦语,比较了不同的分词方法,在英语和尼日利亚皮钦语之间建立了良好的翻译基础。
PDF
4 years ago
Prev
Next