语义 Web 技术在机器翻译中的应用:调研
本论文研究了语义 Web 机器学习(SWeML)系统,评估了其特征和趋势,并提出了一个本体分类系统。结果表明,SWeML 系统应用广泛,特别是在深度学习和知识图谱技术的推动下,呈快速增长趋势。
Mar, 2023
通过语言技术平台,本文提出了一种计算方法,用于评估基于参考翻译并结合语义依赖和句子关键词信息的机器翻译的语义正确性,并通过实验证明与类似方法相比,该评估算法的准确性得到了提高,能更准确地测量机器翻译的语义正确性。
Apr, 2024
本研究发现提前识别翻译技巧并应用于机器翻译过程可以进一步优化机器翻译,通过不同实验对从头翻译和后编辑两种翻译过程进行了预测,预测准确率分别达到 82% 和 93%。
Mar, 2024
无监督神经机器翻译中的实时反向翻译与多语言预训练是主要方法,该论文通过人工语言的实验,发现词汇、句法和语义属性并不能充分解释反向翻译成功的原因,但是语义信号能通过反向翻译改进两种语言的对齐,推测多语言间存在平行的丰富语义依赖,这证明了无监督机器翻译的成功并非分析性的保证,并希望能够确定哪些共同性可用于无监督、跨语言工具的开发。
Mar, 2024
Web 内容通常被翻译成多种语言,多语言机器翻译常常质量较低,且低资源语言中占大部分的内容是机器生成的多语言内容;我们发现内容选择偏差,即低质量英文内容通过机器翻译大规模转译成较低资源语言;我们的研究对使用从网上刮取的单语和双语数据来训练多语言大型语言模型等模型提出了严重的疑虑。
Jan, 2024
本文追溯了现代神经机器翻译体系结构的起源,重点探讨了单个神经网络在翻译中的应用,其中涉及到 word 和 sentence embedding 以及编码器 - 解码器网络家族的早期示例,并总结了该领域的最新趋势。
Dec, 2019
该文提出了一种主动学习方法,将小批量的人工翻译添加到机器翻译的训练集中,利用人工和机器翻译的优点,并提出了新颖的聚合获取准则来帮助方法选择要手动翻译的话语,实验证明这种理想话语的选择能显著降低翻译数据中的误差和偏见,从而比仅在机器翻译数据上训练的解析器具有更高的精度。
May, 2023
本文提出了一种基于多任务学习方法,利用源端的单语言语言资源来解决神经机器翻译中由于缺少平行文本造成模型质量差的问题,并采用语义分析、句法分析和命名实体识别等辅助任务以将语义和 / 或句法知识注入到翻译模型中,实现了在英法、英波斯和英越三种翻译任务上的有效性验证。
May, 2018
使用神经网络在配对设置下进行机器翻译评估的框架,以从一对假设中选择更好的翻译为目标。该框架将参考和两个假设的词汇、句法和语义信息嵌入到紧凑的分布式向量表示中,并提供了一个与人类判断相关的 MT 评估度量。
Oct, 2017
本文研究通过机器翻译将其他语言翻译成英文进行多语言文本分析,结果表明这种方法在情感分析,主题分析和词嵌入等分析方法上,与使用源语言进行分析的结果相当,机器翻译可以帮助计算机学者做出关于人类沟通的更具包容性和普适性的结论。
Jan, 2023