Jul, 2022

非参数变分信息瓶颈下的变压器变分自编码器

TL;DR本文提出了一种基于变分信息瓶颈的变分自编码器(VAE)改进方法,用于 Transformers 的嵌入空间优化,通过 Bayesian nonparametrics 方法获得非参数的变分信息瓶颈(NVIB)以规范注意机制支持的向量数量和向量中的信息量,为 Encoder-Decoder 模型引入 NVIB,提出了一种非参数化可变自编码器(NVAE),并在自然文本上证明了其有效性。