BriefGPT.xyz
Ask
alpha
关键词
vocabulary generation
搜索结果 - 3
领域内翻译最佳微调的词汇和 BPE 设置的系统分析 —— 以 NMT 为例
本文对不同的子词分词策略、词汇生成方法及 Fine-tuning 进行了系统的实证研究,旨在找到一种最佳的 Fine-tuning 领域特定模型的设置,实验结果表明最好的模型达到了比基线模型 6 个 BLEU 分数的提升效果。
PDF
a year ago
句向量排序模型的极端压缩:在边缘设备上实现更快的推理、更长的电池续航和更少的存储
本篇研究提出了在两种不同类型的 ranker 模型上扩展句子转换蒸馏过程的两种方法,包括生成最优尺寸的词汇表和在蒸馏之前对教师的嵌入维数进行降维。结果表明,采用这些扩展技术的学生模型具有极大的压缩程度,而且在测试数据集上表现出高度的有效性和
→
PDF
2 years ago
EMNLP
利用语言聚类词汇改进多语言模型
本文比较现有多语言模型词汇表生成方法,提出了一种新的多语言词汇表生成方法。实验证明,该方法能够提高多个语言上的推理性能,同时在不增加模型大小或数据的情况下,将语言识别率降低了 8 倍。
PDF
4 years ago
Prev
Next