- ACL通过最小化与句法翻译格子相关的贝叶斯风险进行神经机器翻译
该研究提出了一种将神经机器翻译(NMT)与传统的统计机器翻译(SMT)相结合的新方案,利用贝叶斯风险进行组合,并成功地在英德和日英翻译方面得到了显著的提升。
- ACL英印机器翻译重排序规则
本研究使用一种丰富的规则来重新排序源语句,以改善基于短语的 SMT 系统中的训练和解码效果。使用开源 SMT 工具包 MOSES 开发系统,通过 BLEU、NIST、多参考词错误率、多参考位置无关错误率等多重重要度量标准,验证所提升方法带来 - EMNLP通过字节对编码学习相关语言之间的可变长度单位
本文研究了使用字节对编码(称为 BPE units)以及拼音音节作为翻译任务基本单元的效果, 结果表明,BPE units 作为翻译单元略优于拼音音节单元, 并且更适用于非元音书写系统的语言。
- COLING神经机器翻译的预翻译
使用词汇短语转换(phrase-based machine translation)方法预处理输入,进而提升神经机器翻译(NMT)的翻译质量,在英德翻译任务中,使用该方法的性能跃升 2 个 BLEU 分数,同时分析了初始系统质量对最终结果的 - AAAI由统计机器翻译指导的神经机器翻译
本文提出了将 SMT 模型融入 NMT 框架,通过辅助分类器和门函数来结合 SMT 的推荐和 NMT 的生成,从而提高中英翻译的性能。实验结果表明,该方法在多个测试集上均显著优于现有的 NMT 和 SMT 系统。
- EMNLP神经网络与基于短语的机器翻译质量比较:一个案例研究
本文分析了神经网络机器翻译(NMT)与基于短语的机器翻译(PBMT)在英语 - 德语翻译数据集上的表现,从专业翻译的高质量后编辑结果中发现神经网络机器翻译在表述动词重新排序等语言现象时具有更好的建模能力,但仍有需要改进的方面。
- COLING基于短语的统计机器翻译自适应连接
提出了基于短语的 SMT 数据选择方法,该方法能够在 IWSLT/NIST 数据集上提高 SMT 性能(相比短语基线系统增加 1.6,相比现有方法增加 0.9)。
- IJCAI利用 N-Best 假设改进 SMT 法进行语法纠错
本文提出了一种利用 SMT 方法生成的 n 种翻译假设来提高 GEC 准确率的新方法,即利用分类器评分来选择适当的编辑或对 n 种翻译假设进行重新排序,并将这些方法应用于使用 SMT 方法的最新 GEC 系统中,实验结果表明,我们的方法在 - MM基于 Bandit 结构预测的统计机器翻译部分反馈学习
通过提出的带约束预测 (Bandit Structured Prediction) 方法,只利用预测点处的任务损失函数值的非精确反馈,在统计机器翻译中完成了矫正重排序的任务,且仍能取得较高的翻译质量。
- ACL多模态图像描述翻译中的基准
本文提供了一种使用视觉空间中的多模态支点改善图像描述的统计机器翻译方法。通过在一个用目标语言描述的图像数据库中执行图像检索,并使用最相似图像的描述进行跨语言重新排序,达到优化的效果。本方法不依赖于大量域内平行数据的可用性,而仅依赖于大量单语 - 增强的双语评估助手
本研究通过在 Bilingual Evaluation Understudy(BLEU)评估技术上进行改进,提出了一种适应人类评估的评估技术,该技术可以考虑包括同义词和词序在内的变化,并且与现有的评估方法相比,有较好的改进和相关性。
- ACL使用多任务张量网络的统计机器翻译特征
提出了一种以神经网络为基础的三重方法,用以改善统计机器翻译,并在阿拉伯语 - 英语和中文 - 英语翻译上实现了显著改进,包括新的神经网络特征、张量层和多任务学习。
- ACL基于卷积神经网络的上下文依赖翻译选择
该研究提出了一种基于卷积神经网络的翻译选择方法,该方法可以判断两种语言中短语对之间的相似性,以及在源语言中包含短语的上下文,通过渐进式学习,能够更好地表示词组和句子级上下文,实验结果显示,与基线系统相比,该方法能够显着提高 1.4 个 BL - 使用全局句子表示进行本地翻译预测
该论文探索了使用源语言全局句子级特征来预测目标语言本地翻译,并提出了一种新的双语限制基于块的卷积神经网络来学习语义表示,并使用局部和全局信息的前馈神经网络来更好地预测翻译质量。实验表明,该方法可以在翻译质量方面得到实质性的提高。
- 统计机器翻译中的单词重排:计算模型和语言现象调查
许多研究已经发表了关于如何在统计机器翻译中处理单词重排序的问题,然而,这个领域还有很多挑战需要面对,因此作者提出了一种综合性的调查来描述如何在不同的 SMT 框架和作为单独的任务中对单词重排序进行建模,并通过基于大量语言知识的定性分析,论证 - NIPS机器翻译的贝叶斯优化
本文提出了一种使用贝叶斯优化算法进行最小误差率训练的新型统计机器翻译系统,探索了两类算法来高效地探索翻译空间,其中一类基于 N-best 列表,另一类基于超图表示法,同时介绍了一种随机嵌入算法来扩展我们的方法以处理稀疏高维特征集。
- ACL神经网络语言模型的增量适应策略
本文提出了两种优化神经网络语言模型适应新数据的方法,包括在重新采样数据上进行继续训练或插入适应性层。在 CAT 环境中应用于 SMT 系统中,这两种方法均取得了显著的改进。
- EMNLP使用 RNN 编码器 - 解码器学习短语表示,用于统计机器翻译
本文提出了一种名为 RNN Encoder-Decoder 的神经网络模型,该模型由两个循环神经网络(RNN)组成,它将符号序列编码成固定长度的向量表示,并将该表示解码成另一个符号序列,并通过联合训练编码器和解码器来优化目标序列的条件概率, - 句法知识对英汉机器翻译的帮助作用
本文旨在探究各种参数设置下最先进的统计机器翻译系统,以提高像英语 - 印地语这样的 “远距离” 语言对翻译的质量,并提出了新的有效的重排序技术和简单预处理步骤,以显著改善翻译结果的质量。
- DGT-TM:22 种语言免费提供的翻译记忆
该篇论文介绍了欧盟委员会翻译总局推出的包含 22 种官方语言的翻译记忆库,该资源不仅可用于翻译专业人员提高速度和一致性,还可用于翻译学和语言技术应用,包括统计机器翻译、术语提取、命名实体识别、多语言分类和聚类等。