Dec, 2017
基于注意力机制的序列到序列模型最小词错率训练
Minimum Word Error Rate Training for Attention-based Sequence-to-Sequence Models
Rohit Prabhavalkar, Tara N. Sainath, Yonghui Wu, Patrick Nguyen, Zhifeng Chen...
TL;DR本文研究了训练注意力机制的序列到序列模型来直接最小化期望的单词错误率,通过实验证明通过 N-best 列表的解码假设比基于模型的采样方法效果更好,相对于基准系统性能提高了 8.2%。