通过知识检测自我训练大型语言模型

Jun, 2024

通过知识检测自我训练大型语言模型

Self-training Large Language Models through Knowledge Detection

Wei Jie Yeo, Teddy Ferdinan, Przemyslaw Kazienko, Ranjan Satapathy, Erik Cambria

TL;DR该论文研究自训练范式，其中大型语言模型 (Large language models, LLMs) 通过自主策划标签并选择性地在未知数据样本上训练，以显著改善多个主题中生成中的虚构问题。此外，选择性训练框架在处理超出分布基准的灾难性遗忘时具有重要意义，解决了训练 LLMs 过程中的关键限制。我们的研究结果表明，这种方法可以大幅减少对大规模标记数据的依赖，为更可伸缩和经济有效的语言模型训练铺平了道路。

Abstract

large language models (LLMs) often necessitate extensive labeled datasets and training compute to achieve impressive performance across downstream tasks. This paper explores a self-training paradigm, where the LL

large language models self-training paradigm autonomous curation hallucination reduction catastrophic forgetting

发现论文，激发创造

语言模型能够在无外部监督的情况下自主学习

大语言模型（LLMs）在追求超人类表现时，传统上一直依赖于人类注释的数据集和预定义的训练目标 - 这是一种既费时又固有有限的过程。本文提出了一种变革性的方法：自主学习 LLMs，这是一种无监督学习范式，使模型摆脱了人类监督的限制。我们的方法使 LLMs 能够通过与文本的直接交互来自我教育，类似于人类阅读和理解文学。我们的实证结果表明，自主学习在综合实验中表现优于预训练、监督微调以及检索增强方法。这些发现突显了自主学习不仅可以提高 LLMs 训练的效率和效果，还可以为更先进、自主的人工智能系统的发展铺平道路。

Jun, 2024

大型语言模型可自我提升

本文提出了一种方法，使用未标注的数据进行自我训练和推理提高，通过 fine-tuning 在多个任务上达到了 SOTA 水平。

Oct, 2022

进入未知领域：自学习大型语言模型

我们提出了一种自学习 LLM 框架，通过对自身幻觉的自我评估，使 LLM 能够独立学习先前未知的知识。通过幻觉评分，我们引入了一个新概念 Points in The Unknown（PiUs），以及一种外在和三种内在的自动 PiUs 识别方法，从而在 Points in The Unknown 的知识差距中创建一个自学习循环，从而减少幻觉评分。我们还开发了评估指标来衡量 LLM 的自学习能力。我们的实验表明，经过微调或调整的 7B-Mistral 模型具有相当好的自学习能力。我们的自学习概念可以实现更高效的 LLM 更新，并为知识交流开辟新的视角，这也可能增加公众对 AI 的信任。

Feb, 2024

提升大型语言模型的数据生成能力

本文提出了一种统一的数据创建流程，只需一个格式示例，适用于包括传统上问题较多的任务在内的广泛范围，通过实验证明使用指令跟随型大型语言模型创建的数据比使用人工标注的数据在分布外评估上表现更好（高达 17.5%），同时在分布内任务上保持可比较的性能，这些结果对于在现实世界中部署的自然语言处理系统的稳健性具有重要意义。

Oct, 2023

了解 LLMs 不知道的内容：一种简单有效的自我检测方法

提出了一种新颖的自我检测方法，通过扩展问题的文本表达并收集相应的答案，检测大型语言模型（LLMs）是否会产生虚假回答，证明了该方法在 LLM 效果上的有效性。

Oct, 2023

自带数据！面向大语言模型的自监督评估

提出了一种自监督评估框架，用于分析大型语言模型的敏感性或不变性，以测量其中的知识、毒性、远程上下文依赖性等特征，以及语法结构和令牌化错误，这一自监督评估可直接监视大量的真实数据，以帮助评估大型语言模型的行为表现。

Jun, 2023

学会相信自己的感受：在语言模型中利用自我意识缓解幻觉

通过使用知识探测、一致性检查和强化学习等方法，我们发现大型语言模型在辨别和表达其内部知识状态方面具有强大的自我意识，然而它们在生成过程中常常无法表达其内部知识，导致虚构。为此，我们提出了一种自动虚构注释工具，通过梦网，该工具将知识探测和一致性检查方法结合起来，以排名虚构偏好数据。通过使用知识偏好作为奖励，我们提出了一种从知识反馈中强化学习（RLKF）的训练框架，利用强化学习增强大型语言模型的真实性和诚实性。我们对多个模型进行的实验证明，RLKF 训练有效地增强了模型利用其内部知识状态的能力，在各种基于知识和诚实性的任务中提高了性能。

Jan, 2024

增强 LLMs 与知识：关于幻觉防止的调查

将预训练语言模型与外部知识源相结合，可以增强其上下文处理能力，克服传统语言模型的问题，如错觉、无依据的回答和可拓展性挑战。

Sep, 2023

利用大型语言模型进行零样本命名实体识别的自我提升

通过自我改进策略研究了零样本实体识别任务中大规模语言模型的应用，并提出了利用无标注语料库刺激模型自学能力的自我改进框架，通过全面实验分析发现，该自我改进框架能够进一步推动零样本实体识别任务的发展，并取得了显著的性能提升。

Nov, 2023

大型语言模型是否知道自己不知道的？

本研究评估了大语言模型的自我认知能力，通过引入自主问答数据集和一种自动化方法来检测不能回答的问题，研究发现大语言模型具有一定的自我认知能力，可以通过上下文学习和指导调整进一步提高其自我认知。但是，研究还发现，这些模型与人类在识别知识限制方面存在明显差距。

May, 2023