Jun, 2024

个性化联邦学习视角下的低资源机器翻译

TL;DR基于个性化联邦学习算法 MeritFed 的新方法,适用于具有异构数据的自然语言任务,在低资源机器翻译任务中,我们使用来自大规模多语言机器翻译共享任务(小轨道 2)的数据集和芬乌格里亚语族多语言基准测试中子集的萨米语进行评估。除了其有效性外,MeritFed 也具有高解释性,因为它可以应用于跟踪每种训练语言的影响。我们的分析结果显示目标数据集大小影响辅助语言之间的权重分布,无关语言不会干扰训练,辅助优化器参数的影响很小。我们的方法易于应用,只需几行代码,并提供了用于重现实验的脚本。