EMNLPSep, 2019

分布式鲁棒性语言建模

TL;DR本文研究语言模型在未知测试分布下的性能问题,并提出了一种基于分布鲁棒性的优化方法,称为主题条件风险值(topic CVaR),该方法能够在广泛的潜在测试分布下表现良好,并且在使用 Yelp 评论和新闻混合训练语言模型,并仅在评论数据上进行测试时,相对于标准最大似然估计法(MLE),实现了 5.5 点困惑度的降低。