Oct, 2023

基于统计的深度学习算法对 Transformer 文本嵌入进行排名和表征

TL;DR基于 Transformer 的文本嵌入的流行性呼吁更好的统计工具来衡量这些嵌入的分布。本文介绍了一种用于测量 transformer-based 文本嵌入分布的统计深度方法 TTE depth,并在自然语言处理流程中引入了该深度的实际应用,包括建模和分布推断。研究使用 TTE depth 对上下文学习提示选择任务进行了实验,展示了该方法相对于统计基准方法在六个文本分类任务上可靠提升性能的结果。最后,研究使用 TTE depth 及其相关的秩和检验特征了合成和人工生成语料库的分布,显示出五种最近的合成数据增强过程导致与相关的人工生成文本发生可测量的分布偏移。