人工对齐中的语言模型微调中的数据多样性扩展

COLINGMar, 2024

人工对齐中的语言模型微调中的数据多样性扩展

Scaling Data Diversity for Fine-Tuning Language Models in Human Alignment

Feifan Song, Bowen Yu, Hao Lang, Haiyang Yu, Fei Huang...

TL;DR通过控制文本样本数量，本研究发现更多回复但更少提示比大量的提示更能触发语言模型与人类一致，此外，提出了提示多样性的新公式，并使用数据增强进行了实验证明其对不同算法的效果。

Abstract

Alignment with human preference prevents large language models (LLMs) from generating misleading or toxic content while requiring high-cost human feedback. Assuming resources of human annotation are limited, ther

language models human preference diversity prompt diversity fine-tuning

发现论文，激发创造

基于 LLM 的文本增强中多样性激励对样本多样性和下游模型性能的影响

最新的生成型大规模语言模型（LLM）被应用于数据增强任务，在这些任务中使用少量文本样本进行 LLM 重述，然后用于模型的微调。本研究调查了三种在众包中广泛使用的文本多样性激励方法：禁忌词、先前异常解决方案的提示和先前异常解决方案的链接，并使用它们作为指导 LLM 对文本数据集进行增强的一部分的指令，测量它们对生成文本的词汇多样性和下游模型性能的影响。我们比较了在 5 种不同 LLM 和 6 个数据集上的影响效果。研究结果表明，禁忌词对多样性的增加最为显著，而使用先前创建的重述作为提示时下游模型性能最佳。

Jan, 2024

通过群体评议和自我投票改进大型语言模型中的民族代表多样性

大型生成语言模型的关键挑战是多样性，本文通过提出度量多样性的评估数据集和指标，并应用集体批判和自我投票等方法，有效提高模型对人群和文化的多样性。

Oct, 2023

从大型语言模型中我们能提取多少种不同的观点？基于评判标准的多样性激励！

调查了大型语言模型（LLMs）在生成多样化观点和理由方面的能力，提出了一种基于标准提示技术来衡量透视多样性的方法，并发现利用句子嵌入和距离度量来衡量语义多样性是不够的。研究结果表明，LLMs 能够根据任务主观性的程度产生多样的观点。

Nov, 2023

利用大语言模型和人工干预进行文本数据生成以增加多样性并维持准确性

本文研究人工智能与人类合作生成高质量的大语言模型数据，使用两种方法促进文本生成的多样性和准确性，探究人类干预的效果并发现标签替换有助于提高模型的准确性，但移除超出用户领域兴趣或没有适当标签的实例不能提高模型准确性，需要更多人机协作探索。

Jun, 2023

基于软提示调节的大型语言模型偏置评估

本文探讨在情感分类任务上使用软提示调整识别大型语言模型（LLMs）如 OPT 和 Galactica 语言模型中的偏见，使用群体公平性（偏见）来检查模型偏见，并发现有趣的偏见模式，以便在实践中部署这些模型之前，识别这些偏见。

Jun, 2023

大型语言模型的思维多样性提高推理能力

通过改变输入提示的多样性，并借助多种演绎方法，我们提出的 DIV-SE 和 IDIV-SE 方法在不改变解码过程的前提下，通过多种推理调用和单次推理调用中的多样提示，在固定生成预算的情况下，在多个推理基准和最新的计划基准上，优于现有基线，并在最有挑战的 4/5 Blocksworld 任务上超过先前报告的最高准确率至少 29.6 个百分点，从而改进了 LLM 推理的准确性 - 成本权衡的帕累托前沿。

Oct, 2023

大型语言模型的社会偏见评估需求提示变化

本研究探讨了大型语言模型（LLMs）在不同提示变化下对任务表现和社会偏见的敏感性，发现 LLMs 对提示的敏感程度很高，可能导致在任务表现和社会偏见方面的模型排名波动。此外，在优化社会偏见和任务表现之间存在权衡，而高级 LLMs 的示例模糊性是导致对提示敏感性的原因之一。因此，建议使用多样化的提示来比较提示对 LLMs 社会偏见的影响。

Jul, 2024

大型语言模型对齐的多样化偏好

通过混合不同的人类偏好数据集以增加数据量来增强奖励建模的方法可能失败，因此该研究提出了一种名为 MORE 的新的训练策略，通过自适应调整偏好目标来捕捉不同偏好中的共享人类价值观，实验证明 MORE 相较于其他方法在奖励准确性和校准误差方面有更好的表现。

Dec, 2023

大型语言模型作为属性训练数据生成器：多样性和偏见的故事

本文研究了使用多样元数据指导训练数据生成方法，证明其在多样性和属性生成方面都比单一指导明显更好，同时降低了查询成本。

Jun, 2023

哪种提示更具差异性？用于高效人工 LLM 评估的数据排序

通过度量方法，我们的研究旨在最小化人工评估所需的注释数量，从而提高评估质量并减少时间和成本。我们发现，这种方法有效地降低了模棱两可的结果，对于未来大型语言模型评估具有重要意义。

Oct, 2023