通过自然语言和多样化数据集改进多语言指导微调

Jul, 2024

通过自然语言和多样化数据集改进多语言指导微调

Improving Multilingual Instruction Finetuning via Linguistically Natural and Diverse Datasets

Sathish Reddy Indurthi, Wenxuan Zhou, Shamil Chollampatt, Ravi Agrawal, Kaiqiang Song...

TL;DR利用英语为主要依据的大型语言模型（LLMs）、单语语料库和评分函数，我们提出了一种新颖的方法来收集多语言的指令微调（IFT）数据集，以保持语言的自然性和确保批示的多样性。实验证明，使用我们的 IFT 数据集进行微调的 LLMs 在生成和判别任务方面都显示出显著的改进，表明 LLMs 在非英语环境中的语言理解能力得到了提升。特别是在多语言摘要任务中，使用我们的 IFT 数据集进行微调的 LLMs 相对于采用基于翻译和基于模板的数据集进行微调的 LLMs 分别实现了 17.57% 和 15.23% 的改进。

Abstract

Advancements in large language models (LLMs) have significantly enhanced instruction-following capabilities. However, most instruction fine-tuning (IFT) datasets are predominantly in English, limiting model perfo

large language models instruction fine-tuning multilingual ift datasets language comprehension

发现论文，激发创造

M2Lingual：大型语言模型中的多语言、多轮指令对齐增强

指导微调（IFT）对于使大型语言模型（LLM）遵循指令非常关键。本文提出了一个全新的完全合成的多语言多轮指导微调数据集（M2Lingual），称为 Evol，以更好地使 LLM 在多种语言和任务中对齐。M2Lingual 包含 182K 个基于不同种子构建的 IFT 对，涵盖了 70 种语言、17 个 NLP 任务和一般的指令 - 响应对。使用 M2Lingual 微调的 LLMs 在许多现有的多语言 IFT 数据集中表现出色。重要的是，使用 M2Lingual 训练的 LLMs 在广泛的评估基准上始终能够达到与现有的多语言 IFT 数据集相媲美的竞争结果。因此，我们提出了用于创建 M2Lingual 的 2 步 Evol 分类法。

Jun, 2024

COCO 是视觉指导微调所需的全部

利用 COOC 数据集和更多多样化指令建立了新的多模态大语言模型指令细调数据集，实验证明用该数据集进行的细调在单轮和多轮对话设置中，在开放式评估基准上能够获得更好的性能。

Jan, 2024

Aya 数据集：一份用于多语言指导调优的开放获取集合

本研究针对英语语言数据集的局限性，通过与全球流利的语言使用者合作，建立了覆盖 65 种语言的人工策划指令跟随数据集，并通过模板和翻译现有数据集创建了迄今最广泛的多语言数据集，共包含 5.13 亿个实例。此外，我们还提供 Aya 注释平台、Aya 数据集、Aya 集合和 Aya 评估套件等四个关键资源，而且 Aya 倡议还是一项有价值的参与性研究案例，涉及来自 119 个国家的合作者，我们认为此为未来旨在弥补资源差距的研究合作提供了宝贵的框架。

Feb, 2024

UltraLink：一种开源的知识增强的多语言监督微调数据集

本研究构建了一个开源的多语言监督微调数据集，通过引入基于知识的数据增强方法提高了大语言模型从不同国家的用户中获取文化特定知识的能力，并通过实验发现现代大语言模型表现出强大的跨语言转移能力，从而有效地减少了语言无关的微调数据，使得微调过程更加高效。基于构建的 UltraLink 数据集进行训练的 UltraLink-LM 在多个任务上优于其他代表性基线模型。

Feb, 2024

大型语言模型的分阶段指导微调

通过渐进对齐的假设，我们提出了一种新颖的分阶段指令微调（Phased IFT）方法，基于难度评分并使用逐步训练的方式显著地提高了预训练语言模型的指令遵循能力。

Jun, 2024

参数高效的鲁棒性全语种持续学习微调

研究 Continual Multilingual Learning 的问题，提出使用 parameter-efficient finetuning 更新 multilingual model 来减少语言特异性的遗忘，同时提高跨语言转移能力，通过 LAFT-URIEL pipeline 来改善支持语言的性能

Sep, 2022

仅需一点多语言知识的多语言教学优化

通过研究多语言指令调整多语言大型语言模型的效果，我们发现跨语言转移以及将多语言示例用于指令调整对多语言指令跟随具有显著的改进作用。

Jan, 2024

大型语言模型的指令调优中的零 - shot 跨语言转移

在多语种环境下，我们对指令调优进行了系统研究，发现跨语言转移成功的关键在于超参数调整和足够的训练数据，虽然英文训练的大型语言模型能够生成其他语言的正确、全面和有帮助的回答，但其可信度较低且可能偶尔出现流畅性错误。

Feb, 2024

通过使用翻译指示进行多语言微调，引发大型语言模型的翻译能力

本篇论文通过对一个多语种预训练语言模型 XGLM-7B 进行微调并给出指示进行多语种翻译的实验，展示了预训练语言模型在翻译任务中的较强能力，并发现其翻译能力依赖于对翻译指令的理解和语言之间的对齐，研究结果可启发模型改进。

May, 2023

重新审视指令精调模型评估以指导工业应用

指导微调（IFT）是一种强化大型语言模型（LLM）的零样本能力的强大范式，但在此过程中引入了新的评估指标要求。我们展示了基于 LLM 的评估指标适应这些要求，并利用它们对任务专业化策略进行调查，量化在实际工业环境中出现的权衡。我们的发现为从业者在实际的 IFT 模型部署中提供了可行的见解。

Oct, 2023