Jan, 2023

序列推荐中的互惠瓦石均方差最小化

TL;DR本文提出了一种基于互信息的无监督学习框架,利用 Wasserstein 距离来衡量自然语言推荐任务中的互信息,并提出了可应用于小批量数据的 Wasserstein 差量度量方法和基于反向对比损失的训练方式,证明该方法能够减少不稳定的 KL 散度限制,达到更稳健的表现。