ACLJun, 2018

政策梯度作为组块分析中动态 Oracle 的代理

TL;DR本研究探讨使用策略梯度方法作为独立于特定解析器转移系统的替代动态预言机的多元组监督方法,以直接优化 F1 指标并在训练期间进行探索,从而减少暴露偏差。在三种不同语言的四个成分解析器中,该方法在几乎所有情况下都比静态预言机似然训练方法表现出更高的效果。