ACLApr, 2021

优化编码器以改进单语和零样本多语言神经主题建模

TL;DR本研究提出多种 fine-tuning 编码器的方法,包括在辅助任务中 fine-tuning,构建新的主题分类任务,将主题分类目标直接整合到主题模型训练中,和继续预训练,实验证明在主题分类和主题模型中直接结合主题分类任务的编码器 fine-tuning 能够有效提高主题质量,同时对于跨语言转移来说,编码器 fine-tuning 是最重要的因素。