MinPrompt: 基于图的极简提示数据增强用于少样本问题回答

Oct, 2023

MinPrompt: 基于图的极简提示数据增强用于少样本问题回答

MinPrompt: Graph-based Minimal Prompt Data Augmentation for Few-shot Question Answering

Xiusi Chen, Jyun-Yu Jiang, Wei-Cheng Chang, Cho-Jui Hsieh, Hsiang-Fu Yu...

TL;DR该研究提出了一个基于最小数据增强框架的开放领域问答系统，通过使用近似图算法和无监督问题生成，选择最具信息量的数据集进行微调，从而在效率上实现可比较或更好的准确性，提高了 F-1 分数高达 27.5%。

Abstract

few-shot question answering (QA) aims at achieving satisfactory results on machine question answering when only a few training samples are available. Recent advances mostly rely on the power of pre-trained large languag

few-shot question answering pre-trained large language models fine-tuning data augmentation open-domain qa

发现论文，激发创造

基于提示的少样本问答合成数据生成

使用大型语言模型在少样本学习 Set 中提高问题回答的性能。

May, 2024

通过提示进行弱监督的对话理解数据增强

本论文探讨了在缺少数据资源的情况下，利用预先训练好的语言模型进行对话理解中的数据增强的问题，并提出了一种利用弱监督滤波器迭代增强质量的新方法。实验结果表明，在 DailyDialog 和 Facebook 多语言任务导向对话的情感、行为和意图分类任务上使用少量数据作为辅助训练集，可以达到或超过现有的最佳性能。

Oct, 2022

CuriousLLM: 提升多文档问答与推理注入的知识图提示

在问答领域中，将大型语言模型与外部数据库结合已经取得了巨大的成功。然而，这些方法在提供复杂问答任务所需的高级推理方面常常效果不佳。为了解决这些问题，我们改进了一种称为 “知识图谱提示” 的新方法，该方法结合了知识图谱和基于大型语言模型的代理以提高推理和搜索准确性。然而，原始的知识图谱提示框架需要在大型数据集上进行昂贵的微调，并且仍然存在着大型语言模型幻觉的问题。因此，我们提出了一种注入推理能力的大型语言模型代理来增强该框架。这种代理模仿人类的好奇心来提问后续问题，以更高效地导航搜索。这种简单的改进显著提升了大型语言模型在问答任务中的性能，而无需承担初始 “知识图谱提示” 框架的高成本和延迟。我们的最终目标是进一步发展这种方法，在问答领域提供更准确、更快速、更具成本效益的解决方案。

Apr, 2024

基于提示的填空数据增强生成式少样本问答

本研究开发了 Gotta，一种基于生成式提示的的数据增强框架，旨在改善 few-shot question answering 学习中深层语义推理的挑战。研究表明，Gotta 始终优于竞争基线，验证了基于提示调整的背景填充任务的有效性，在 QA 任务中学习指导推理并提高语言模型扩展任务能力的优点。

Jun, 2023

PromptDA: 基于标签的数据增强，针对基于提示的小样本学习

本研究利用丰富的标签语义信息提出了一种新颖的标签引导数据增强框架 PromptDA，通过有效地利用标签语义和数据增强来提高自然语言理解的性能，以解决如何为基于 Prompt 的 few-shot 调整设计有效的数据增强方法的重要研究问题。

May, 2022

利用语言模型提示的多跳 QA 的少样本重新排序

本文提出了一种基于大型语言模型的 PromptRank 方法，可用于多跳 QA 的少样本重新排序，该方法构建一个基于指令的提示，在给定问题和路径提示的条件概率下计算给定问题和文档路径之间的相关性得分，并且在 HotpotQA 数据集上具有强大的检索性能。

May, 2022

AUG-FedPrompt: 基于数据增强 Prompt 的实用 Few-shot 联邦 NLP

本研究提出了一种基于数据增强的联邦学习算法 AUG-FedPrompt，针对 NLP 中数据稀缺和隐私保护等问题，使用少量有标签数据与海量无标签数据训练，可在联邦学习任务中取得与使用全部有标签数据进行微调一致的表现。

Dec, 2022

跨域问答泛化学习

通过结合提示方法和线性探针 fine-tuning 策略，我们提出了一种新颖的方法，可以有效提高生成模型和判别模型的泛化能力，特别在跨领域问题回答 (QA) 任务上表现优异。

May, 2023

知识增强语言模型为零 - shot 知识图谱问答做准备

提出了一种通过直接在 LLM 的输入中添加知识以增强其内部存储的知识的方法，称为 KAPING，通过在知识图上检索相关事实来改善零 - shot 闭书问答任务性能，经验证跨多个大小不同的 LLM，基于事实的知识增强方法相对于相关零 - shot 基线的平均表现提高达 48%。

Jun, 2023

通过少量训练示例提升互联网语言模型用于开放领域问答

该研究旨在通过使用大规模语言模型（LSLM）独特的少样本能力，借助于 Google 搜索返回的信息对语言模型进行少量提示，从而克服其与现实事实和最新信息相关性的挑战，从而使得模型在开放领域问题回答方面的性能优于相同或更大规模的封闭书模型，同时，增加推理时间的计算能力可以提高模型的性能。

Mar, 2022