- HYKIST 项目中越南语自动语音识别的无监督预训练
通过开发音频识别和机器翻译系统以改善医患沟通,该研究旨在为解决医疗领域的语言难题提供支持,探讨训练计划和数据整合策略,以优化性能。
- VAKTA-SETU: 一种选择印度语言的语音到语音机器翻译服务
本文介绍了面向英 - 印度语、英 - 马拉缇语和印度 - 马拉缇语语言对的部署就绪的语音 - to 语音机器翻译(SSMT)系统,该系统通过级联自动语音识别(ASR)、行话校正(DC)、机器翻译(MT)和文本 - to 语音合成(TTS)模 - 使用大型语言模型的自适应机器翻译
本文旨在探究如何利用上下文学习的方法来提高实时自适应机器翻译的质量,并研究将强编码器 - 解码器模型和模糊匹配相结合以进一步提高翻译质量的方法。已在五个大不同的语言对上展开了实验。
- 非分段输入的同步翻译:滑动窗口方法
提出一种基于滑动窗口的方法来翻译语音识别输出,实验结果表明比传统的 ASR 分段方法提高了 1.3-2.0 BLEU 分数,且减少了重新翻译的需要。
- 交互式知识辅助机器教学框架
该研究提出了一个机器教学设计框架,讨论了人类老师的效率和机器学习性能的影响。作者详细介绍了一个特定于文本分类问题的机器教学系统,该框架聚焦于教学界面、机器学习器和知识库的关系,初步实验表明 MT 系统可以减少人类教学时间和机器学习器误差率。
- 紧密集成的级联语音翻译端到端训练
本文提出了一种端到端的可训练语音翻译模型,通过优化所有 ASR 和 MT 模型的参数而避免级联模型中的误差传播,并且通过使用人工神经网络实现 backpropagation 传递误差以实现同时提供转录和翻译,对于四个不同数据场景的实验表明, - MetaMT, 一种利用多个领域数据的元学习方法,用于低资源机器翻译
通过操纵训练数据可得到鲁棒的用于 MT 的神经模型。
- 使用测试套件对德英机器翻译进行语言评估
本文介绍了应用语法测试套件对 WMT19 提交的德语 - 英语机器翻译系统的结果,其中包含 107 个类别的详细分析。研究表明,这些系统中有四分之一的测试项目翻译错误率仍很高,其中包括习语、动词语态等。与去年相比,功能词、非动词一致性和标点 - 机器翻译的质量期望
该论文旨在讨论机器翻译是如何被应用的,如何评估其输出,以及如何提高机器翻译的质量,特别是作为人类翻译的生产力增强工具,其中需要考虑翻译本身的预期生命周期以及质量评估等问题。
- MM语音翻译中区分 ASR 和 MT 的错误
研究自动评估口语翻译质量的方法,通过单一分类器检测 ASR 和 MT 模块可能导致的 SLT 错误,并针对 3 种任务标注提出了两种标签提取方法。
- EMNLP基于词组的统计机器翻译语言模型
本文研究了基于短语的语言模型,针对机器翻译使用引入了全面的基于短语的语言模型,并通过初步实验结果表明,相比于基于单词的语言模型,我们的方法在困惑度和翻译质量方面表现更好。