探测分类器：承诺、缺陷和进展

Feb, 2021

Probing Classifiers: Promises, Shortcomings, and Advances

Yonatan Belinkov

TL;DR探测分类器作为解释和分析自然语言处理深度神经网络模型的一种突出方法论已经被广泛应用。然而，最近的研究表明了其方法上的各种局限性。本文批判性地回顾了探测分类器框架，突出了其优点、缺点和进展。

Abstract

probing classifiers have emerged as one of the prominent methodologies for interpreting and analyzing deep neural network models of natural language processing. The basic idea is simple -- a classifier is trained

probing classifiers deep neural network models natural language processing methodological limitations advances

发现论文，激发创造

使用线性分类器探测中间层

通过监测神经网络模型每个层的特征并测量其对分类的适用性，使用线性分类器（即 “探针”）完全独立于模型本身进行训练，这有助于更好地理解中间层的作用和动态，并可用于诊断潜在问题。将此技术应用于 Inception v3 和 Resnet-50 等流行模型，实验证明，特征的线性可分性沿模型深度单调增加。

Oct, 2016

利用探测预测微调性能

本研究探讨了使用轻量 Probing 方法去解释 NLP 模型内在机制的方法，通过对三项探测测试的准确性精确预测了模型的调优表现，为 NLP 模型的发展提供了可能。

Oct, 2022

人工神经网络探究：来自神经科学的启示

这篇文章探讨从神经科学角度出发，在进行机器学习的探索性研究时，通过指定研究目标且明确探针设计的方向和表现性来实现对于感兴趣特征激活模式的监督模型

Apr, 2021

在上下文中进行探究：通过对大型语言模型进行探查以构建强大的分类器

本文介绍了一种名为 'in-context probing' 的方法，能够更好地提高大型语言模型在分类任务中的鲁棒性，并证明了这种方法在与提供的指令变化较大时更具可靠性。

May, 2023

探针分类器在概念移除和检测中不可靠

研究人员发现，基于文本数据训练的神经网络模型存在不可取的语言或敏感概念问题。本文通过广泛的理论和实证分析，证明了使用事后和对抗方法无法完全删除有问题的概念，并有可能破坏所有有用任务特征，并建议使用伪度量衡量最终分类器的质量。

Jul, 2022

DirectProbe: 无需分类器的表示研究

本研究基于任务版本的概念，通过发展一种启发式工具 DirectProbe 直接研究表示物的几何结构，揭示了嵌入空间如何表示标签，并预测了分类器的性能。

Apr, 2021

通过提示探测

本文提出了一种无模型的探测方法 —— 提示探测法，通过在 5 个探测任务上的实验表明，这种方法在提取信息方面与诊断探针相当或更好，并且可以自我学习得更少。此外，结合关注头修剪与提示探测法，分析模型在其架构中存储语言信息的位置，并通过删除对特定语言属性至关重要的头部来评估预训练的有用性。

Jul, 2022

通过发现子网络进行低复杂度的探测

提出一种基于减法修剪的探测方法，相较于多层感知机探测方法，该方法在预训练模型上的准确性更高，而在随机模型上的准确性更低，且在探测复杂度上占据优势，通过对不同任务的分析，我们发现较低层次的任务被编码在较低的层数中。

Apr, 2021

知识树：基于知识神经元的梯度提升决策树作为探测分类器

使用梯度提升决策树作为语言模型中隐藏层的检测分类器，相对于逻辑回归于转换器层的输出表示，用于识别句子部分更具优势，并且比许多其他方法更可取，根据预置设置，错误率的增益范围为 9-54%。

Dec, 2023

信息论探针用于语言结构探索

本文介绍了一种基于信息理论的方法来评估神经网络对自然语言处理的理解程度，即探针，发现在评估中应选择表现最好的模型，即使它是更复杂的模型，以获得更紧密的估计和更多的语言信息。作者在多种语言数据集上进行实验验证了这种方法的有效性。

Apr, 2020