使用自然语言说明训练分类器

ACLMay, 2018

Training Classifiers with Natural Language Explanations

Braden Hancock, Paroma Varma, Stephanie Wang, Martin Bringmann, Percy Liang...

TL;DR本研究提出了 BabbleLabble 框架，使用人类的自然语言解释来训练分类器，得到了具有可比 F1 得分的分类器。此外，针对标记函数的固有不完美性，我们发现简单的基于规则的语义解析器就足以胜任。

Abstract

Training accurate classifiers requires many labels, but each label provides only limited information (one bit for binary classification). In this work, we propose babblelabble, a framework for training

classifiers babblelabble natural language explanation annotation semantic parser

发现论文，激发创造

CLUES: 使用自然语言解释学习分类器的基准

研究使用自然语言来训练从语言中零样本学习结构化数据的分类器，并提出一个评估标准 CLUES，其包含 36 个现实世界和 144 个合成分类任务的自然语言监督。为实现此目的，开发了 ExEnt，一种基于蕴含的模型，通过学习解释来学习分类器。

Apr, 2022

ALICE: 用对比自然语言解释的主动学习

提出了一种专家循环训练框架 ALICE，它利用对比的自然语言解释来提高学习的数据效率，通过提取和动态更改学习模型的结构来应用于鸟类物种分类和社会关系分类两个视觉识别任务中，验证结果表明，相较于使用 40-100% 更多的训练数据的基线模型，应用对比解释后的模型效果更加出色，而添加一个解释获得的性能增益与添加 13-30 个标记训练数据点的性能增益相当。

Sep, 2020

提高模型健壮性的自然语言纠错的澄清

通过 Clarify，用户仅需提供短文本描述来描述模型的连续失败模式，然后我们完全自动化地使用这些描述来改善训练过程，以重新加权训练数据或收集额外的有针对性的数据，并通过用户研究表明，非专业用户可以成功地通过 Clarify 描述模型的误解，从而在两个数据集中将最差组精确度平均提高 17.1％，此外，我们使用 Clarify 在 ImageNet 数据集中找到并纠正了 31 个新的困难子群体，将少数群体的精确度从 21.1％提高到 28.7％。

Feb, 2024

超越标签：通过新型主动学习结构为人类提供自然语言解释的支持

该研究提出了一种新的主动学习框架，通过加入自然语言解释生成模型，实现在低资源条件下减少标签和解释注释的人工成本，并提升了决策方案生成的效果。

May, 2023

自然语言分类器的多分辨率解释和诊断工具

通过对 NLP 模型中的观察段或语义相关的词群进行分析，将解释性摘要方法更加灵活化，并通过分析不同段落的虚假或肯定例子，引入了 NLP 模型的根本原因分析方法。最后，通过对 Yelp 评论数据集的实验证明，利用单词和 / 或信息中的组 / 集群结构可以帮助解释 NLP 模型的决策，并可用于评估模型对性别，语法和单词含义的敏感性或偏差。

Mar, 2023

使用神经执行树学习解释

本文提出了一种新的神经执行树（NExT）框架，通过语义分析将自然语言解释转换为可执行的逻辑形式，并使用该框架增强文本分类的训练数据，实验证明它在两种自然语言处理任务上（关系提取和情感分析）的表示能力优于基线方法。

Nov, 2019

教我解释：可解释自然语言处理数据集综述

本文总结了解释性自然语言处理领域近年来集中收集人类注释的文本解释，将其分为三类 (highlights, free-text, and structured) 并对其注释方法进行整理，提出了现有采集方法的优点和缺点，给出了未来收集数据集的建议。

Feb, 2021

通过对话式解释探索 NLP 模型和数据集的 InterroLang

通过在 NLP 领域中使用具有自由文本理性化功能的对话系统，研究人员对 NLP 任务进行了改进，并通过评估模型性能和用户研究，证明了理性化和特征归因在解释模型行为方面的有效性。

Oct, 2023

利用大型语言模型为人类导师提供解释性反馈

研究表明，学习者参与制作解释以支持他们的推理过程，对学习有积极影响。本文介绍了两种方法，可供教师在在线课程中提供实时反馈，并介绍了采用大型语言模型促进的命名实体识别的增强方法的进展。

Jun, 2023

利用解释作为潜在变量实现可解释的自然语言理解

本文提出了一种可解释自然语言理解的框架，使用一小部分人类注释的解释进行训练，并采用变分 EM 方法进行优化，同时提出了基于解释的自训练方法，在两个自然语言理解任务上进行实验，证明了该框架不仅可以在监督和半监督设置下进行有效的预测，还可以生成良好的自然语言解释。

Oct, 2020