个性化联邦学习视角下的低资源机器翻译

Jun, 2024

个性化联邦学习视角下的低资源机器翻译

Low-Resource Machine Translation through the Lens of Personalized Federated Learning

Viktor Moskvoretskii, Nazarii Tupitsa, Chris Biemann, Samuel Horváth, Eduard Gorbunov...

TL;DR基于个性化联邦学习算法 MeritFed 的新方法，适用于具有异构数据的自然语言任务，在低资源机器翻译任务中，我们使用来自大规模多语言机器翻译共享任务（小轨道 2）的数据集和芬乌格里亚语族多语言基准测试中子集的萨米语进行评估。除了其有效性外，MeritFed 也具有高解释性，因为它可以应用于跟踪每种训练语言的影响。我们的分析结果显示目标数据集大小影响辅助语言之间的权重分布，无关语言不会干扰训练，辅助优化器参数的影响很小。我们的方法易于应用，只需几行代码，并提供了用于重现实验的脚本。

Abstract

We present a new approach based on the personalized federated learning algorithm meritfed that can be applied to natural language tasks wi

personalized federated learning meritfed natural language tasks low-resource machine translation interpretability

发现论文，激发创造

低资源神经机器翻译元学习

本文利用元学习算法 (MAML) 扩展低资源 NMT 问题，并通过多语言高资源任务进行学习来适应低资源语言，并利用全局词汇表解决不同语言的输入输出错配，在使用 18 种欧洲语言作为源任务和 5 种不同的语言作为目标任务的情况下，相对于基于多语言、迁移学习的方法，表明所提出的方法显著优于现有方法，并仅需少量训练示例即可获得具有竞争力的 NMT 系统。

Aug, 2018

大型语言模型的个性化无线联邦学习

基于大型语言模型的联邦学习方法，在无线网络中解决了隐私和安全保护机制不足的问题，并通过两种个性化无线联邦微调方法实现了低通信开销。

Apr, 2024

面向多语言神经机器翻译的适配器通信高效联邦学习

本文提出了一种新的联邦式多语言神经机器翻译框架。相比中心化训练，该框架通过模型同步，只传输轻量化的适配器模块，降低了模型同步的通信代价。作者同时探索了各种聚类策略来减少冲突，并在适配器模块上进行了修剪，成功地提出了通信效率。实验结果表明，该框架在实现相当甚至更好的性能的同时，可以将通信代价降低 98% 以上。

May, 2023

仅传递所需内容：在联邦多语言机器翻译中学习高效通信

本文提出了一种基于元学习的自适应参数选择方法 MetaSend，通过学习客户端在不同联邦学习轮次之间的张量偏差，提高了联邦学习多语言神经机器翻译中模型传输过程的通信效率，并在有限通信预算下，在两个具有不同语言分布的数据集上的翻译质量方面表现出了显著提升。

Jan, 2024

异构语言任务和客户资源下的分布式大型语言模型微调

FlexLoRA 是一种用于 LLM fine-tuning 的聚合方案，通过动态调整本地 LoRA 等级并使用奇异值分解（SVD）进行权重重新分配，充分利用了异构客户端资源。在涉及超过 1,600 个客户端执行多样化的自然语言处理（NLP）任务的实验中，证实了 FlexLoRA 的有效性，联邦全局模型在下游 NLP 任务性能方面平均提高了 3.1%。FlexLoRA 的实用性进一步强调了其与现有的基于 LoRA 的联邦学习方法的无缝集成和理论分析，提供了一种可扩展的、隐私保护的 LLM 联邦调整路径。

Feb, 2024

面向医学转录分析的联合多语言模型

该论文介绍了一个针对医学实体标注等下游任务的大规模多语言模型的联邦学习系统，它能够跨越高度异质化的数据提供者进行训练，并通过本地训练步骤进一步提高全局模型的性能。

Nov, 2022

全球联合训练语言模型

通过联邦学习，在全球范围内构建联邦的语言模型训练系统 (WorldLM)，以解决大规模语言模型训练所面临的法律、安全、隐私等挑战，并通过局部模型本地化、残差层嵌入等方法，提升性能并保护隐私。

May, 2024

通过翻译和注解融合实现更好的低资源实体识别

使用 TransFusion 模型将低资源语言的文本翻译成高资源语言进行训练及注释，再将结构融合回低资源语言，有效提升跨语言命名实体识别 (NER) 的性能。

May, 2023

多语言联邦学习预训练模型

本文揭示了多语言对联邦学习的影响，从语言建模、机器翻译、文本分类三个任务中选用联邦算法和非联邦算法进行对比，结果表明预训练模型可以减少联邦学习的负面影响，使其表现接近或优于中心化（无隐私）学习，即使使用非独立同分布分区。

Jun, 2022

语音转文本任务的高效个性化联邦学习

为了保护隐私并满足法规要求，提出了一种个性化的联邦语音转文本框架，通过引入轻量级的客户端调试和服务器交互模块，以减小通信开销；并通过使用全局模型配备的 k 最近邻分类器来捕捉客户端特定的分布偏移以实现个性化，并克服数据异质性。实验证明，该方法在所有语音转文本任务中显著减少通信开销，并有效地个性化全局模型以克服数据异质性。

Jan, 2024