定义 AI 增强的 CAI 工具的最大可接受延迟
探究跟随原演讲者或译员进行自动同声传译的语音翻译系统能够在保持翻译质量的前提下,增加可提供的语言范围,从而通过 ESIC 进行英语到捷克语的研究,比较人类译员与机器翻译系统之间的差异,并进行人类评价以衡量信息损失。
Jun, 2021
该研究介绍了一种称为 Differentiable Average Lagging (DAL) 的潜在模型,可用于追踪同步系统的延迟。该模型可用于同时机器翻译,并在语音转录,实时流媒体和会话翻译方面具有重要应用。
May, 2019
对话系统中的定时关键,6 种语言的自然对话数据的词错误率仍然糟糕,重叠问题是一个关键挑战,对话词语的识别受到影响,进而对下游意图识别产生严重后果。
Jul, 2023
本文的研究目的是为了提高口头对话系统的自然度,通过一些预训练模型和特征,预测对话系统主动发起回合的时间点,并在 Switchboard Corpus 上实现了更好的性能表现。
Aug, 2022
通过分析谷歌自然问答数据库,本文展示了 GPT-4 可在超过 60%的时间内从问题末尾的遗漏词语有效填补丢失的上下文,并探讨了这种信息损失对发展中的角色模型质量的影响,同时提出了使用简单分类器来确定是否需要填充短语以满足人类对话时间限制的问题是否语义完整。
Apr, 2024
本文介绍了 Interpreter Assist,这是一种针对 RSI 场景设计的计算机辅助口译工具,包括自动词汇表创建工具和实时建议系统两个主要功能,通过基准测试得出了词汇表创建的质量和相关性以及实时建议功能的精度和召回率。
Jan, 2022
评估口译服务的表现是一项复杂的任务,尤其是在应用自动评估方法时,本研究旨在通过分析自动度量与人工评估之间的相关性来评估同传口译的可靠性,结果表明 GPT 模型,特别是 GPT-3.5 具有最强的语义相似性相关性,即使在评估短文本片段时也是如此。
Jun, 2024
本文提出了一种面向实际应用场景的实时语音翻译系统 SimulS2ST,支持 57 种语言对英语的翻译,具备实时调节输出延迟的功能,能够非常快速地进行语音翻译。
Jun, 2023