NIPSNov, 2018
从人类修正反馈中学习的反事实语义分析
Counterfactual Learning from Human Proofreading Feedback for Semantic Parsing
Carolin Lawrence, Stefan Riezler
TL;DR通过对历史系统中的模型输出提供人类可理解的语句,并将其转换为学习信号,我们介绍了新的估算器,并讨论了如何将我们的反馈收集方法无缝地集成到部署的虚拟个人助手中,从而证明了从记录的人类反馈数据中,可以通过反事实学习显著提高语义解析器。