使用神经机器翻译预测人类翻译难度
Google 发布的 GNMT 神经机器翻译系统采用 LSTM 深度学习网络,使用 attention 机制和残差连接,借助词元素 (wordpieces) 将单词划分为子单元,提高了稀有单词处理能力与整体系统精度。
Sep, 2016
本研究提出了工具和度量方法来评估机器翻译模型中数据不确定性的捕捉,以及这种不确定性如何影响生成翻译的搜索策略。我们的结果表明,搜索功能表现出色,但模型往往在假设空间中分散了太多的概率质量。此外,我们还提出了评估模型校准的工具,并展示了如何轻松解决当前模型的一些缺陷。
Feb, 2018
通过统计测试、机器学习算法和多维分析方法,本研究探讨 ChatGPT 生成的翻译与神经机器翻译(NMT)及人工翻译(HT)之间的可区分性、语言特征以及相似程度。结果表明,ChatGPT 生成的翻译在大多数多维分析维度上与 NMT 更相似,并展示出高准确性的监督分类结果,而无监督聚类技术的效果不尽人意。这些新颖的发现揭示了这三种翻译类型之间的相互关系,并对 NMT 和生成型人工智能的未来发展具有重要意义。
Dec, 2023
本论文提出了一种基于神经机器翻译的实时翻译框架,通过代理决策来实现翻译输出实时化并且具有可控的翻译质量与延迟,通过在两种语言对上的实验结果表明了该方法在定量与定性方面的有效性。
Oct, 2016
本文追溯了现代神经机器翻译体系结构的起源,重点探讨了单个神经网络在翻译中的应用,其中涉及到 word 和 sentence embedding 以及编码器 - 解码器网络家族的早期示例,并总结了该领域的最新趋势。
Dec, 2019
本研究测试了在专业翻译中使用神经机器翻译(NMT)是否能够节省人工处理时间,并发现更好的 MT 系统确实能够减少英文到捷克文翻译过程中的修改次数,但是质量和编辑时间之间的关系并不是直接的关系,并且与短语词汇表机器翻译不同的是,BLEU 不能稳定预测时间或最终输出质量。
Sep, 2021
本研究发现提前识别翻译技巧并应用于机器翻译过程可以进一步优化机器翻译,通过不同实验对从头翻译和后编辑两种翻译过程进行了预测,预测准确率分别达到 82% 和 93%。
Mar, 2024
本文重新评估了一项最近的研究 (Hassan et al.,2018),即使用成对排序法并考虑到三个变量,重申机器翻译在从中文到英文的新闻翻译方面已达到人类水平,我们提供了一组人类评估未来机器翻译的建议。
Aug, 2018
本文研究了基于 Transformer 的语言模型中,各种训练数据和不同容量的模型对于预测人类阅读时间的作用,并发现多数具有当代模型能力的变体,使用约 20 亿个训练标记后,所给出的 surprisal estimates 提供了最佳适合度,而较大的预先训练语言模型的较差适合度主要归咎于大量的训练数据,而 transformer-based 语言模型的某种程度的模型容量对于模型要捕捉类似于人类的期望是必要的。
Apr, 2023
本研究通过翻译关系的视角探讨神经机器翻译(NMT)和人工翻译(HT)之间的区别,以评估 NMT 系统产生的翻译技术,并回答三个关键研究问题:NMT 和 HT 之间整体翻译关系的差异,它们如何使用非字面翻译技术,以及影响它们使用特定非字面技术的因素的变化。该研究使用了两个平行语料库,每个语料库涵盖了九种类型的文本,其中一个由 NMT 翻译,另一个由人类翻译。这些语料库中的翻译关系在对齐的句对上进行了手动注释,从而实现了对语言洞察力的比较分析,包括语义和句法细微差别,如上位词和词性标注的改变。结果表明,与 HT 相比,NMT 在各种类型中更倾向于进行字面翻译。虽然 NMT 在句法非字面翻译技术的运用上与 HT 相当,但在语义层面的表现却有所不足。
Mar, 2024