机器翻译致命错误的网络风险：以阿拉伯语心理健康推文为案例研究

May, 2024

机器翻译致命错误的网络风险：以阿拉伯语心理健康推文为案例研究

Cyber Risks of Machine Translation Critical Errors : Arabic Mental Health Tweets as a Case Study

Hadeel Saadany, Ashraf Tantawy, Constantin Orasan

TL;DR介绍了一个关于机器翻译关键错误的真实数据集，指出了常见机器翻译存在的伦理和安全问题以及目前常用质量评估指标无法识别关键错误的重要性。

Abstract

With the advent of neural machine translation (NMT) systems, the MT output has reached unprecedented accuracy levels which resulted in the ubiquity of MT tools on almost all online platforms with multilingual content. However, NMT systems, like other state-of-the-art AI generative syst

neural machine translation hallucinations fluent mistranslations critical errors

发现论文，激发创造

来自非母语者的文本的神经机器翻译

本研究研究神经机器翻译系统中的数据噪声问题以及如何通过增加包含人工引入的语法错误句子的训练数据来提高其对错误的鲁棒性，同时提出了一套用于测试神经机器翻译在处理语法错误上的 JFLEG 语法纠错语料库的西班牙语翻译。

Aug, 2018

推进以诚信为核心的人工智能：神经机器翻译中的道德挑战和解决方案

该论文讨论了神经机器翻译系统中人工智能所面临的伦理挑战，强调开发人员确保公平性和文化敏感性的必要性。通过实证研究和文献综述，我们考察了神经机器翻译开发的各个阶段中涉及的伦理问题，包括数据处理、隐私、数据所有权和同意。此外，我们还研究了正义和公平问题，探讨了人工智能系统与人类之间责任的分配，并强调人类监督在维护神经机器翻译伦理标准方面的重要作用。最后，我们还从圣经角度讨论了神经机器翻译的社会影响以及开发者更广泛的伦理责任，将他们视为对自己创造物的社会后果负责的守护者。

Apr, 2024

医生对机器翻译中的临床危害的检测：质量估计有助于信赖和反向翻译发现关键错误

机器翻译的实际应用中一个重要的挑战是用户缺乏决策指导，本文通过在高风险的医疗环境中模拟决策过程，评估了质量估计反馈对决策的影响，发现质量估计提高了适当依赖机器翻译的能力，但与仅使用质量估计相比，后翻译帮助医生发现了更多常常被质量估计忽视的临床上有害的错误。

Oct, 2023

大型多语种翻译模型中的幻觉

本研究针对大规模多语言机器翻译，分析了 M2M 常规神经机器翻译模型和通用的 ChatGPT 模型中幻觉翻译的普遍性、特性和缓解措施，以期构建更加稳定和可信的机器翻译系统。

Mar, 2023

机器之间的机器翻译：情感分类应用案例

提出了一种神经机器翻译的方法，利用一种新的候选采样策略，基于强化学习技术提高翻译模型的机器导向性，从而产生最适合用作特定下游任务的自然语言处理组件输入的翻译结果，这种方法可以显著提高英文分类器对 Twitter 数据的情感分类的性能。

Oct, 2019

利用合成噪音提高机器翻译的鲁棒性

本文介绍借助带有自然噪声的大型数据集从而使得机器翻译系统更加鲁棒，提升其抗噪能力并部分缓解由此产生的精度损失。

Feb, 2019

面向心理保健信息的谷歌翻译错误分析：准确性、可理解性评估及对多语言保健沟通的意义

本研究探讨了使用 Google Translate（GT）翻译心理保健（MHealth）信息的可行性，并通过分析从英语到波斯语、阿拉伯语、土耳其语、罗马尼亚语和西班牙语的 MHealth 领域的 GT 输出，评估其准确性、易读性和对多语种医疗保健交流的影响。研究发现 GT 在翻译医学术语方面存在挑战，特别是在阿拉伯语、罗马尼亚语和波斯语中，同时影响了阿拉伯语和西班牙语的理解能力。对于特定上下文，如波斯语、土耳其语和罗马尼亚语的项目符号格式，存在严重错误。尽管对于较长文本的翻译有所改善，但仍然需要提高医学和心理健康术语的准确性和流畅性，并解决格式问题以提供更流畅的用户体验。该研究结果凸显了 MHealth 翻译需要使用定制翻译引擎以及仅依赖机器翻译医学内容时的挑战，强调人工审核者在多语种医疗保健交流中的关键作用。

Feb, 2024

机器翻译中算法偏见对语言复杂性的影响

本文研究机器翻译中偏见放大的问题，探究算法的偏见增强对语言是否会产生贫化作用。作者测试了不同的数据驱动机器翻译范式，并发现所有测试的语言对中，都存在词汇和形态上的丧失。

Jan, 2021

翻译迷失：机器翻译中语言丰富性的流失和衰退

本研究基于实证数据分析了机器翻译与人为翻译之间的词汇丰富性损失，结果表明当前机器翻译系统在保留人类语言文本的词汇多样性方面尚有不足，而其倾向于加剧常见模式并忽视不常见模式的特点，可能会加重针对性别的偏见等问题，并可能导致算法本身的偏见问题。

Jun, 2019

神经机器翻译质量与后编辑表现

本研究测试了在专业翻译中使用神经机器翻译（NMT）是否能够节省人工处理时间，并发现更好的 MT 系统确实能够减少英文到捷克文翻译过程中的修改次数，但是质量和编辑时间之间的关系并不是直接的关系，并且与短语词汇表机器翻译不同的是，BLEU 不能稳定预测时间或最终输出质量。

Sep, 2021