大规模持续预训练用于零样本和少样本的文档问答

Aug, 2023

大规模持续预训练用于零样本和少样本的文档问答

DocPrompt: Large-scale continue pretrain for zero-shot and few-shot document question answering

Sijin Wu, Dan Zhang, Teng Hu, Shikun Feng

TL;DR本文提出了用于文档问答任务的 Docprompt 模型，具有强大的零样本和少样本性能。通过提出一种新的弱监督数据生成方法、新的多阶段训练方法和新的理解模型与生成模型集成方法，实验证明在文档问答任务上继续预训练后的 Docprompt 模型明显优于现有的强基线模型。该方法极大地提高了文档问答客户项目的交付效率和模型性能，降低了注释成本和劳动成本。

Abstract

In this paper, we propose docprompt for document question answering tasks with powerful zero-shot and few-shot performance. We proposed a

docprompt document question answering zero-shot performance few-shot performance delivery efficiency

发现论文，激发创造

持续预训练以提高零样本和少样本提示能力

本研究探讨了在语言模型提示方法中继续预训练阶段是否能够提高零 - shot 以及少量样本情况下语言模型的性能，并通过大规模实验表明使用多任务学习的实时递归预训练策略可将零 - shot 及几轮试验下的效果提高至 31% 相对性能，然而使用元学习方法的继续预训练阶段的性能不佳。我们提出了针对不同应用的具体推荐，以优化语言模型的性能。

Oct, 2022

多模式提示下的零备和少备视频问答

近期的视觉 - 语言模型主要面临有限数据下的过拟合、灾难性遗忘以及视觉与语言之间的跨模态差距等挑战，本研究引入了一种参数高效的方法来解决这些问题，通过结合多模态提示学习和基于 Transformer 的映射网络，在预训练模型的冻结状态下实现。在几个视频问答基准测试中，我们的实验结果证明了我们的方法在性能和参数效率方面在零样本和少样本设置下的优越性。我们的代码可以通过该 https 网址获得。

Sep, 2023

ZeroPrompt：通过扩展预训练任务数到 1,000 项，提高零样本推理能力

本文提出了一种多任务预训练方法 ZeroPrompt，它可以在很多任务上进行训练，并且可以显著提高零样本学习的效率和性能。

Jan, 2022

零样机任务推广的提示一致性

本文探讨了如何利用未标记的数据以提高自然语言处理任务的零样本性能，并通过规范提示一致性来鼓励模型的一致预测，并取得了实验结果上的进展和成果。

Apr, 2022

PSP: 面向少样本抽象摘要的预训练软提示

通过新颖的软提示体系结构和提示预训练加微调范式，研究了少样本主动式摘要生成的挑战性任务，使得模型仅调整了极少数的参数。结果显示，与调整所有模型参数的完全模型调优相比，我们的方法在 CNN/DailyMail 和 XSum 数据集上表现得更好，同时也超过了大规模加提示的 Prompt Tuning，并使用只有 3% 的模型参数的 Prefix-Tuning 取得了有竞争力的结果。

Apr, 2022

使用零射击启发局部差分隐私文档生成

使用 DP-Prompt 及类似 ChatGPT 的强大语言模型在 IMDB 数据集上进行实验，发现其能够有效减少 de-anonymization 攻击成功率，并在与现有方法相比设计更简单的情况下，完全恢复了清洁情感 F1 分数，同时在对抗静态攻击者和自适应攻击者方面分别实现了 46% 和 26% 的减少

Oct, 2023

预训练语言模型为什么比零 / 少样本学习者更好？

本文提出了一种理论框架，以解释在零 / 少样本场景下提示学习的功效，我们进一步假设语言差异可以衡量提示的质量，并且通过基于 perplexity 的注释无关模板选择方法，使我们能够提前预测提示性能。

Sep, 2022

多任务提示训练实现零样例任务泛化

通过将广泛多样的监督数据集转换为易读提示集合的方式，使用预先训练的编码器 - 解码器模型进行多任务学习可以直接导致强大的零 - shot 表现，该方法能够在多个标准数据集上表现出比同类模型大多数情况下强 16 倍的性能，并在 BIG-bench 基准测试中的某些任务上表现出比同类型模型强 6 倍的性能。

Oct, 2021

POUF: 面向提示的无监督微调大规模预训练模型

本研究提出一种无监督的精调框架，用于快速和直接地向未标记的目标数据进行深度学习模型的预训练，并在图像分类、情感分析和自然语言推理任务中实现了持续的改进。

Apr, 2023

AdaPrompt：基于提示的自然语言处理自适应模型训练

通过利用任务和提示的特征，AdaPrompt 使预训练语言模型不断预训练，提高了 NLP 方面几个基准测试中的表现，在零样本情况下相对误差降低了高达 26.35％。

Feb, 2022