Feb, 2024

TexShape: 语言模型的信息论句子嵌入

TL;DR通过信息理论的角度,本文致力于解决与将句子编码为其优化表示相关的挑战,特别关注数据领域中的资源利用、隐私和公平问题,并使用经验估计的相互信息,在 (task-based) 数据压缩或过滤敏感信息的过程中,训练了一种信息理论的句子嵌入模型,称为 TexShape。我们的实验证明,通过在压缩的数据上训练下游模型的预测准确性来保留最大化的目标信息和最小化的敏感信息,可以在不良的压缩比例方面取得显著进展。