关键词order-agnostic cross entropy
搜索结果 - 2
- 非自回归机器翻译中的语法多模式研究
该论文针对非自回归翻译模型中存在的语法多模式问题进行了系统研究。作者提出了连接时序分类(CTC)和无序交叉熵(OAXE)损失函数来处理不同范围的语法多模式,并设计了一种新的损失函数来更好地处理实际世界数据集中的复杂语法多模式。
- ICML无序交叉熵在非自回归机器翻译中的应用
本文提出了一种新的训练目标,名为非自回归翻译(NAT)模型的无序交叉熵(OaXE),通过改善标准交叉熵损失来改善字词重排序的影响,并解决了 NAT 中的严重多模性问题,有效地提高了翻译性能,在 WMT 基准测试中取得了最新的最佳效果。