Dec, 2023
LlaMaVAE: 通过连续的潜在句子空间指导大型语言模型生成
LlaMaVAE: Guiding Large Language Model Generation via Continuous Latent Sentence Spaces
Yingji Zhang, Danilo S. Carvalho, Ian Pratt-Hartmann, André Freitas
TL;DR深度生成神经网络(如变分自动编码器)与大型语言模型相结合,得到了更好的文本生成控制,并在各种任务中表现出了优于现有模型的性能。