信息熵探测的贝叶斯框架

EMNLPSep, 2021

A Bayesian Framework for Information-Theoretic Probing

Tiago Pimentel, Ryan Cotterell

TL;DR该论文提出了一种名为贝叶斯互信息的新框架，它从贝叶斯代理的角度分析信息，使得在有限数据情况下处理可以帮助增加信息的同时也有可能削减信息，更加符合机器学习应用的直觉，最终将该框架运用到探针任务中，通过限制可用背景知识来实现抽取的易于性。

Abstract

Pimentel et al. (2020) recently analysed probing from an information-theoretic perspective. They argue that probing should be seen as approximating a →

probing mutual information bayesian agents machine learning background knowledge

发现论文，激发创造

通过互信息的变分下界理解探针行为

自监督表示、线性探测、信息论、互信息、线性可分表示

Dec, 2023

信息论探针用于语言结构探索

本文介绍了一种基于信息理论的方法来评估神经网络对自然语言处理的理解程度，即探针，发现在评估中应选择表现最好的模型，即使它是更复杂的模型，以获得更紧密的估计和更多的语言信息。作者在多种语言数据集上进行实验验证了这种方法的有效性。

Apr, 2020

探究作为归纳偏好的定量化

该研究旨在通过贝叶斯框架度量文本中的归纳偏差量，并通过对 Contextual embeddings 的探究，比较了 fastText 和 BERT 在不同任务上的性能表现差异。

Oct, 2021

DNN 的概率表示：连接互信息和泛化

本文提出了一种概率表示方法，用于准确估计深度神经网络的互信息，并利用估计器验证了信息理论对泛化的解释，得出了比现有方法更紧密的泛化界限。

Jun, 2021

通过近似贝叶斯最优预测进行信息泄露检测

在当今数据驱动的世界中，公开可用信息的广泛传播加剧了信息泄漏（IL）的挑战，提高了安全性问题。本研究利用统计学习理论和信息论建立了一个理论框架来准确量化和检测 IL。该方法通过近似贝叶斯预测器的对数损失和准确度来准确估计互信息（MI），并使用自动化机器学习（AutoML）来近似贝叶斯预测器。研究通过在合成数据集和真实数据集上的实验验证了该方法的有效性。

Jan, 2024

通过互信息神经估计的贝叶斯隐式模型实验设计

对于内隐随机模型，在数据生成分布复杂度很高但采样是可能的情况下，我们应当采用贝叶斯实验设计来最大限度地提高数据与参数变量之间的互信息，并利用基于神经网络的互信息估计来处理计算成本较高的难题，并在模拟研究中展示其可行性。

Feb, 2020

条件探测：在基线之外测量可用信息

研究神经表示在探测实验中的有效性并提出一种条件探测的理论，通过该理论研究发现在条件化非上下文单词嵌入后，部分性质如词性是可以在深层网络中被探测的。

Sep, 2021

高斯过程的信息论元学习

利用相互信息和信息瓶颈的概念对元学习进行了建模，提出了一种通用的可行的框架，用于学习任务描述的随机表示或编码，该表示对于预测验证集具有高度的信息量，并开发了一种基于记忆的算法，用于少样本分类问题的研究。

Sep, 2020

从互信息角度重访语音表征的自监督学习

从信息论的角度出发，了解自监督语音表示学习的现有方法，通过使用互信息来开发度量方法，从而帮助模型设计和选择，并通过线性探测来评估表示的可访问性，展示模型在层次线性探测和语音识别上的性能。

Jan, 2024

广义界限：信息论和 PAC-Bayes 的视角

该研究旨在提供信息论概括界限及其与 PAC-Bayes 的关联的全面介绍，为最近的发展提供基础，广泛面向对概括和理论机器学习感兴趣的研究人员。

Sep, 2023