通过人类赌徒反事实学习改进神经语义解析器

ACLMay, 2018

通过人类赌徒反事实学习改进神经语义解析器

Improving a Neural Semantic Parser by Counterfactual Learning from Human Bandit Feedback

Carolin Lawrence, Stefan Riezler

TL;DR本篇论文研究了如何通过历史系统中用户反馈数据来提高目标系统的性能，并介绍了一种将此框架应用于神经语义解析的方法。该方法的挑战在于适当地重新加权评估器，以避免策略学习中已知的退化现象，并仍能适用于随机梯度优化。为了与人类用户进行实验，我们设计了一个易于使用的界面来收集人类对语义解析的反馈。我们的工作是第一个显示从已记录的人类反馈数据中可以通过反事实学习显著提高语义解析器性能的工作。

Abstract

counterfactual learning from human bandit feedback describes a scenario where user feedback on the quality of outputs of a historic system is logged and used to improve a target system. We show how to apply this

counterfactual learning human bandit feedback neural semantic parsing estimator reweighting human feedback

发现论文，激发创造

从人类修正反馈中学习的反事实语义分析

通过对历史系统中的模型输出提供人类可理解的语句，并将其转换为学习信号，我们介绍了新的估算器，并讨论了如何将我们的反馈收集方法无缝地集成到部署的虚拟个人助手中，从而证明了从记录的人类反馈数据中，可以通过反事实学习显著提高语义解析器。

Nov, 2018

基于确定性日志的旁路反事实学习：统计机器翻译案例研究

本文解决了在风险规避商业语言翻译模型确定性记录历史性翻译，并使用这些记录进行反事实学习过程中存在的问题，实现了从确定性 bandit 日志中进行反事实学习并取得了 2 BLEU 点的提高。

Jul, 2017

学习模拟自然语言反馈进行交互式语义解析

提出了一种利用模拟的自然语言反馈来训练交互式语义解析器的任务和新颖的反馈评估器，证明该反馈模拟器可以在低数据集情况下，生成高质量的自然语言反馈来提高特定解析器的错误纠正能力。

May, 2023

自然语言界面的反事实解释

本文提出了一种基于语义分析的新方法来生成自然语言界面的解释，重点是提供后续解释，描述如何最小修改发言以实现用户的目标。在两项用户研究中，我们证明了我们的方法可以显著提高用户的性能，并且与两种去除实验相比，可以生成更符合用户意图的解释。

Apr, 2022

从自然语言监督中学习语义解析器

发展了一种从自然语言反馈中训练语义解析器的学习算法，为了使其直观可扩展性，该算法使用了用户纠正、会话记录等已有的自然语言数据作为监督信号，相对于使用严谨的逻辑形式或者特定答案的监督方法，可以接受那些并不熟悉语言形式的用户。研究还构建了一个自然语言反馈的对话数据集，并证明该方法对于从这些自然语言监督信号中学习语义解析器是有效的。

Feb, 2019

探究自动生成的反事实数据在情感分析中的有效性

提出了一种自动产生对立数据的方法，基于此数据增广训练集可以有效提高 NLP 模型的性能。

Jun, 2021

基于用户反馈的摘录式问答中的赌博学习模拟

研究从用户反馈中学习抽取式问答，通过模拟反馈使用监督数据，并将问题视为情境臂学习。分析减少数据标注的几个学习场景的特征。显示最初训练的系统可通过用户反馈大幅度改进，并且可以使用现有数据集在新领域部署系统，而无需任何标注。

Mar, 2022

神经逆向生成：更为丰富的数据增强方法

本文提出了 NeuroCounterfactuals 方法，通过松散的对比事实产生更大规模的编辑，从而使得生成的文本包含语言多样性，同时与原始文档相似，使得训练数据增强在情感分类方面取得了良好的效果。

Oct, 2022

借助因果推理增强语言理解

本研究提出了反事实推理模型，在学习少量反事实样本的基础上，通过生成对于每个正面事实样本的代表性反事实样本，并使用回顾模块根据对比反事实和正事实样本来检查模型预测，从而模拟对于困难测试样本的人类反事实思维。该方法在情感分析和自然语言推理方面的广泛实验验证了其有效性。

Jun, 2021

神经机器翻译能否通过用户反馈进行改进？

本研究在 ebay 电商平台上，使用了人类增强的方法来改进神经机器翻译 (NMT)，并通过通过跨语言搜索任务收集的隐式任务反馈，提高了翻译质量和任务效率。

Apr, 2018