May, 2023

语言如何相互影响?研究 LLM 微调期间的跨语言数据共享

TL;DR本研究使用 TracIn 方法分析多语言大模型的跨语言数据共享机制,发现多语言大模型在微调的早期阶段即依赖多语言数据,且随着微调的进行,这种依赖关系逐渐增强,同时还研究了微调语言对特定测试语言上的模型表现的影响。