Jul, 2020

无监督深度强化学习的释义重构

TL;DR本研究提出了一种基于深度强化学习的渐进式无监督改写方法,使用变分自动编码器生成种子改写,然后使用一种新的奖励函数来指导渐进调整种子改写,从而实现在不同域中高质量改写。在4个数据集上的结果表明,该方法在自动度量和用户研究方面优于监督学习和无监督学习的当前先进技术。