May, 2022

多语言模型中的语言中立子网络发现

TL;DR本文使用抽象的彩票票假设,发现不同语言的子网络是拓扑相似的(即语言中性),这使它们成为具有有限性能下降的跨语言转移的有效初始化。