Nov, 2023

基于 Transformer 的变分自编码器中的图引发的句法 - 语义空间

TL;DR通过多任务学习或双编码器架构将分布语义特征和句法结构的编码分离成异构的潜空间,整合基于图和序列模型,通过低秩算子将多个专门的潜在表示注入解码器的注意机制,结果显示所提出的端到端 VAE 架构可以得到更好的潜空间整理,减轻标准 VAE 架构中发生的信息丢失,从而改善语言建模和下游生成任务的性能。