关键词context-aware machine translation
搜索结果 - 6
- ACL对句级双语的恢复文档注释
我们对德语、法语、西班牙语、意大利语、波兰语和葡萄牙语的三个大规模数据集(ParaCrawl、新闻评论和 Europarl)进行了文档级信息的重建,并引入了文档级过滤技术作为传统双语过滤的替代方法。我们通过分析表明,该方法偏好于与上下文一致 - ACL上下文感知的机器翻译与源语言共指解释
通过预测输入中的核指代特征,我们提出了一种可以解释翻译决策的模型,通过利用输入和翻译输出表示中的上下文特征,以提高英语 - 德语数据集、英语 - 俄语数据集和多语言 TED 演讲数据集上的文档级翻译任务 BLEU 分数超过 1.0 的效果。
- ACL上下文感知机器翻译的序列缩短
在此研究中,我们展示了一种特殊情况的多编码器架构,其中源句子的潜在表示被缓存并在下一步中被重复使用作为上下文,这在对比数据集上实现了更高的准确度,并且与单编码器和多编码器方法相比具有相可比的 BLEU 和 COMET 分数。此外,我们还研究 - 确定上下文相关的翻译以进行评估集生成
将手工制作的、语言相关的规则作为输入,我们使用统计工具提供的先进特征(如指代、词性和形态学特征)来选择具有上下文关系的句子对,通过对七种语言对和两个数据集的实验验证,我们开发了 CTXPRO 工具,用于识别需要上下文才能正确翻译的句子,并通 - 量化神经机器翻译中上下文依赖性的可能性
利用模型内部信息量化语言模型生成过程中上下文使用的合理性,并应用于上下文敏感的机器翻译模型,对比模型理由与人工标注,以识别并突显模型翻译中上下文相关的预测及其合理性。
- ACL上下文感知的翻译模型是否关注正确?
本文介绍了一个新的英法数据集,通过该数据集的分析,指出机器翻译模型在消歧代词和多义词方面经常无法利用上下文信息,通过引入 SCAT,作者提出了一种指导注意力策略来促进模型的注意力分配与 SCAT 的支持上下文的一致性。