利用 Cloze 问题进行少样本文本分类和自然语言推理

ACLJan, 2020

利用 Cloze 问题进行少样本文本分类和自然语言推理

Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference

Timo Schick, Hinrich Schütze

TL;DR本文介绍了一种半监督式的训练程序，称之为 PET，用来在低资源环境下学习某些 NLP 任务，并通过将输入示例转化为填空样式的短语来帮助语言模型理解给定任务

Abstract

Some nlp tasks can be solved in a fully unsupervised fashion by providing a pretrained language model with "task descriptions" in natural language (e.g., Radford et al., 2019). While this approach underperforms i

nlp unsupervised learning pretrained language model pattern-exploiting training semi-supervised training

发现论文，激发创造

利用模式挖掘训练的少样本文本生成

该研究中，给出了一种基于预训练语言模型和样本示例结合的方法来解决文本生成的任务，并介绍了基于此方法的 GenPET。实验表明，该方法在摘要和标题生成数据集上的表现均优于常规方法。

Dec, 2020

改进和简化模式利用训练

本文介绍了一种名为 ADAPET 的方法，可以在没有无标注数据的情况下提高 few-shot learning 的性能，在 SuperGLUE 基准测试中表现优于 Pattern Exploiting Training。

Mar, 2021

利用模式挖掘训练增强表格推理

本文采用 Pattern-Exploiting Training 技术对预训练语言模型进行强化，在知识事实和表格推理方面优于当前基准，且更有效地支持信息选项卡的底层推理任务，且该模型对各种字符和单词级扰动具有鲁棒性。

Oct, 2022

自动识别可用作少样本文本分类标签的单词

本文提出一种自动标签到单词映射的方法，通过少量的训练数据，为 few-shot 文本分类任务的处理提供了更高效的方法。

Oct, 2020

自我监督元学习用于少样本自然语言分类任务

本文提出了一种自监督的方法来生成大量的 meta-learning 任务分布，通过这种方法，将 transformer 模型的预训练与 meta-learning 相结合，证明了这种方法能够在 NLP 任务上实现更好的少样本泛化。

Sep, 2020

简单有效的半监督问答

本研究提出一种利用基础文档和少量标注数据进行深度学习提取式问答的方法，并通过对三个不同领域数据集的实验验证了其有效性。

Apr, 2018

Active PETs: 利用 Pattern Exploiting 训练进行少样本论断验证的主动数据标注优先性

提出 Active PETs 方法，利用多种语言模型的 Pattern Exploiting Training 模型的集成来主动选择未标记数据作为标注候选数据。在使用六个不同的预训练语言模型和两个技术事实验证数据集的 few-shot 数据选择上，使用 Active PETs 显示持续改进基线方法，并通过 Active PETs-o 取得更进一步的提高。该方法能够有效选择要标记的实例，即在未标记数据充足但标记资源有限的情况下，使得 few-shot 辩称验证性能持续提高。

Aug, 2022

基于填空翻译的无监督问答

本文探讨了利用无监督方法合成训练集数据以及不匹配的语料库训练 NMT 模型作为 cloze-to-natural question translator 来更有效地训练 QA 模型，这种方法已经在 SQuAD v1 数据集上验证，并且相较于过去的监督学习方法取得更好的表现。

Jun, 2019

CLUES: 使用自然语言解释学习分类器的基准

研究使用自然语言来训练从语言中零样本学习结构化数据的分类器，并提出一个评估标准 CLUES，其包含 36 个现实世界和 144 个合成分类任务的自然语言监督。为实现此目的，开发了 ExEnt，一种基于蕴含的模型，通过学习解释来学习分类器。

Apr, 2022

SocialPET: 社交媒体中少样本立场检测的社交信息指导模式利用训练

社交媒体上的立场检测任务中，我们提出了一种社交感知的方法 SocialPET 来利用语言模型，该方法在仅拥有少量标注实例的情况下，在两个立场数据集上表现出色。

Mar, 2024