Jan, 2025

修剪或重训练:优化多语言模型在爱沙尼亚语中的词汇

TL;DR本研究解决了多语言模型在特定语言,尤其是爱沙尼亚语中的适应性不足问题。通过调整词汇,我们探讨了重训练词汇器与删除未使用标记对模型性能的影响。结果显示,尽管重训练词汇器对命名实体识别任务的性能有所降低,但删除未使用标记并未产生负面影响,表明此方法可有效提高模型效率。