ACLJul, 2019

自主调控互动式序列到序列学习

TL;DR本研究发现自我调节策略决定了何时向老师或自己寻求不同类型的反馈,可视为解决学会学习问题,从而实现了改进的成本感知序列到序列学习,其中自我调节器通过混合包括更正、错误标记和自我监督在内的不同反馈类型来发现最佳成本 - 质量权衡的 ε- 贪心策略,在交互式神经机器翻译中展示了其鲁棒性和可替代主动学习的前景。