LlamaFactory: 统一高效微调 100 + 语言模型

Mar, 2024

LlamaFactory: 统一高效微调 100 + 语言模型

LlamaFactory: Unified Efficient Fine-Tuning of 100+ Language Models

Yaowei Zheng, Richong Zhang, Junhao Zhang, Yanhan Ye, Zheyan Luo

TL;DRLLamaFactory 是一个统一的框架，集成了一套先进的高效训练方法，用户可以通过内置的 Web 界面 LlamaBoard 灵活地自定义 100 多个大型语言模型（LLMs）的微调，我们在语言建模和文本生成任务上经验性地验证了该框架的效率和有效性。

Abstract

efficient fine-tuning is vital for adapting large language models (LLMs) to downstream tasks. However, it requires non-trivial efforts to implement these methods on different models. We present →

efficient fine-tuning large language models llamafactory training methods web ui llamaboard

发现论文，激发创造

Llama 2: 开放基础和优化的聊天模型

我们开发并发布了称为 Llama 2 的预训练和微调的大型语言模型集合，该集合的规模从 70 亿到 700 亿参数不等。称为 Llama 2-Chat 的我们的微调语言模型在大多数测试中优于开源聊天模型，并根据我们的人工评估显示对于有用性和安全性而言可能是闭源模型的合适替代品。我们提供了我们微调和安全性改进方法的详细说明，以便使社区能够在我们的工作基础上进行拓展，并为 Llama 2 的负责任发展做出贡献。

Jul, 2023

LMTuner：一个用户友好且高度可集成的用于对大型语言模型进行微调的训练框架

在大型语言模型的迅猛发展中，高度可用、可集成和可扩展的 LMTuner 系统为迅速和最小人为干预训练大型语言模型提供了解决方案，支持从 300M 到惊人的 130B 参数的单服务器训练。

Aug, 2023

使用经过微调的 Llama 2 GPT 模型的金融新闻分析

Llama 2 大型语言模型的精细调整为金融新闻的多任务分析提供了可能性，根据 PEFT/LoRA 的方法进行了精细调整，研究中对以下任务进行了调整：从金融市场角度分析文本，突出文本的主要观点，总结文本和提取带有适当情感的命名实体。研究结果表明，经过精细调整的 Llama 2 模型可以以特定的响应结构执行多任务金融新闻分析，其中部分响应可以是结构化文本，另一部分数据可以使用 JSON 格式进行进一步处理。提取出的命名实体情感可以被视为具有定量目标变量的监督式机器学习模型中的预测特征。

Aug, 2023

单语或多语指导调优：哪个更好的羊驼

通过使用多语言调优方法研究基础大型语言模型（LLMs）的代价效益，检验了 LLMs 对于单语和多语环境中查询的有效性，并发现多语调优对于 LLMs 在多语环境中的鲁棒性是关键。研究表明，在有限的计算资源情况下，仅使用有限数据集对多语调优模型进行训练，与为每种语言训练单语模型相比具有相同强大的性能。这些发现可作为扩展语言支持的指南，通过使用约束的计算资源进行指令调优。

Sep, 2023

通过跨语言知识传递向羊驼教授一门新语言

该研究探索了以成本效益的方法来适应新的低资源语言的事先训练的大型语言模型（LLMs），特别关注爱沙尼亚语。通过利用 Llama 2 模型，我们研究了将跨语言指令调整与额外的单语预训练相结合的影响。我们的结果表明，即使是相对较少的额外单语预训练再加上跨语言指令调整也能显著提高爱沙尼亚语的结果。此外，我们展示了从高质量的英文指令到爱沙尼亚语的跨语言知识转移，从而提高了常识推理和多轮对话能力。我们的最佳模型 extsc {Llammas} 是首个适用于爱沙尼亚语的开源指令跟随 LLM。此外，我们发布了爱沙尼亚的第一个通用任务指令数据集 Alpaca-est。这些贡献标志着发展适用于爱沙尼亚语的开源 LLMs 的初步进展。

Apr, 2024

高效大型语言模型：综述

大型语言模型在自然语言理解、语言生成和复杂推理等重要任务中展示出了卓越的能力，并有潜力对我们的社会产生重大影响。然而，这些能力所需的资源相当可观，强调了开发有效的技术来解决其效率挑战的迫切需求。本调研以系统和全面的方式概述了高效大型语言模型的研究成果，从模型中心、数据中心和框架中心的角度，将文献进行了分类整理。我们还创建了一个 GitHub 存储库，在这个存储库中收集了本调研中涉及的论文，并将积极维护并整合新的研究成果。希望本调研能为研究人员和从业者提供有价值的资源，帮助他们系统地了解高效大型语言模型的研究进展，并激励他们为这个重要而激动人心的领域做出贡献。

Dec, 2023

LLaMA-Reviewer：通过参数高效微调推进大型语言模型在代码审核自动化中的应用（实践经验报告）

LLaMA-Reviewer 是一个创新框架，利用了 LLaMA（一种流行的大型语言模型）在代码审查领域的能力。通过使用参数高效的微调方法，即使使用了 6.7B 参数的最小 LLaMA 基础模型和有限的微调时期，LLaMA-Reviewer 也能达到现有的面向代码审查的模型的性能。

Aug, 2023

加速单语文本生成的多语言语言模型的简单框架

最近大型语言模型的进展不仅在英语中，还在非英语语言中完成了复杂语言任务的执行。然而，大多数语言模型的分词器（如 Llama）在训练时采用的是以英语为中心的语料库，往往会在非英语语言中过度分词。针对这个问题，我们的研究引入了一种新颖的框架，旨在加快这些语言的文本生成。此框架预测的语言单元较传统的多语言分词器更大，并且专门针对目标语言进行了定制，从而减少了所需的解码步骤。我们的实证结果表明，与标准解码相比，所提出的框架将生成速度提高了 1.9 倍，同时在单语任务上保持了预训练多语言模型的性能。

Jan, 2024

LLaMA：开放高效的基础语言模型

介绍了 LLaMA，包含 7B 至 65B 个参数的基础语言模型，使用公开可用的数据集训练，其中 LLaMA-13B 在大多数基准测试中优于 GPT-3（175B），LLaMA-65B 等模型与最佳模型 Chinchilla-70B 和 PaLM-540B 相竞争。

Feb, 2023

利用精调的大型语言模型进行虚假信息和假新闻检测的分析

利用 PEFT/LoRA 的方法对 Llama 2 大型语言模型进行细调，以用于辨析虚假信息和检测假新闻。该研究中，模型被细调以完成以下任务：解析揭示虚假信息和宣传叙事的文本、事实核查、假新闻检测、操纵分析、提取带情感的命名实体。实验结果表明，细调后的 Llama 2 模型能够对文本进行深度分析，揭示复杂的风格和叙事。命名实体的情感提取可以作为监督机器学习模型中的预测特征。

Sep, 2023