BriefGPT.xyz
Ask
alpha
关键词
language fluency
搜索结果 - 2
无监督深度强化学习的释义重构
本研究提出了一种基于深度强化学习的渐进式无监督改写方法,使用变分自动编码器生成种子改写,然后使用一种新的奖励函数来指导渐进调整种子改写,从而实现在不同域中高质量改写。在 4 个数据集上的结果表明,该方法在自动度量和用户研究方面优于监督学习和
→
PDF
4 years ago
EMNLP
从自然语言监督中学习语义解析器
发展了一种从自然语言反馈中训练语义解析器的学习算法,为了使其直观可扩展性,该算法使用了用户纠正、会话记录等已有的自然语言数据作为监督信号,相对于使用严谨的逻辑形式或者特定答案的监督方法,可以接受那些并不熟悉语言形式的用户。研究还构建了一个自
→
PDF
5 years ago
Prev
Next