定义 AI 增强的 CAI 工具的最大可接受延迟

Jan, 2022

定义 AI 增强的 CAI 工具的最大可接受延迟

Defining maximum acceptable latency of AI-enhanced CAI tools

Claudio Fantinuoli, Maddalena Montecchio

TL;DR本研究探讨了计算机辅助口译工具的系统延迟对译员的认知影响，结果表明译员可以在 3 秒的延迟下进行同时口译，这一结果高于目前可用人工智能技术的典型延迟并为研究更高延迟的基于语境的语言模型提供了前提。

Abstract

Recent years have seen an increasing number of studies around the design of computer-assisted interpreting tools with integrated automatic speech processing and their use by trainees and professional interpreters. This paper discusses the role of →

computer-assisted interpreting tools automatic speech processing system latency simultaneous modality language models

发现论文，激发创造

口译迷惑：从原始语言或口译者翻译

探究跟随原演讲者或译员进行自动同声传译的语音翻译系统能够在保持翻译质量的前提下，增加可提供的语言范围，从而通过 ESIC 进行英语到捷克语的研究，比较人类译员与机器翻译系统之间的差异，并进行人类评价以衡量信息损失。

Jun, 2021

同声传译员表现的自动评估

提出了一种通过建立质量评估 (quality estimation) 方法来预测同声传译工作表现的任务，利用新颖的特征和方法达到了更好的预测准确性

May, 2018

同时机器翻译的流级延迟评估

本文提出了基于重新划分的流级别延迟评估方法，较好地适用于连续的流翻译，并在参考 IWSLT 任务的流式条件下得到成功评估。

Apr, 2021

机器翻译同时性的延迟评估思考

该研究介绍了一种称为 Differentiable Average Lagging (DAL) 的潜在模型，可用于追踪同步系统的延迟。该模型可用于同时机器翻译，并在语音转录，实时流媒体和会话翻译方面具有重要应用。

May, 2019

时间瓶颈：为什么定时和重叠对于对话界面、语音识别和对话系统至关重要

对话系统中的定时关键，6 种语言的自然对话数据的词错误率仍然糟糕，重叠问题是一个关键挑战，对话词语的识别受到影响，进而对下游意图识别产生严重后果。

Jul, 2023

预测口语对话代理的启动点

本文的研究目的是为了提高口头对话系统的自然度，通过一些预训练模型和特征，预测对话系统主动发起回合的时间点，并在 Switchboard Corpus 上实现了更好的性能表现。

Aug, 2022

口语化头像系统的人类相应延迟对话回合

通过分析谷歌自然问答数据库，本文展示了 GPT-4 可在超过 60％的时间内从问题末尾的遗漏词语有效填补丢失的上下文，并探讨了这种信息损失对发展中的角色模型质量的影响，同时提出了使用简单分类器来确定是否需要填充短语以满足人类对话时间限制的问题是否语义完整。

Apr, 2024

KUDO 语言解释助手：远程口译自动实时支持

本文介绍了 Interpreter Assist，这是一种针对 RSI 场景设计的计算机辅助口译工具，包括自动词汇表创建工具和实时建议系统两个主要功能，通过基准测试得出了词汇表创建的质量和相关性以及实时建议功能的精度和召回率。

Jan, 2022

探究人机评估并行口语翻译的相关性

评估口译服务的表现是一项复杂的任务，尤其是在应用自动评估方法时，本研究旨在通过分析自动度量与人工评估之间的相关性来评估同传口译的可靠性，结果表明 GPT 模型，特别是 GPT-3.5 具有最强的语义相似性相关性，即使在评估短文本片段时也是如此。

Jun, 2024

学习何时发声：离线模型下同时语音翻译中的延迟和质量权衡

本文提出了一种面向实际应用场景的实时语音翻译系统 SimulS2ST，支持 57 种语言对英语的翻译，具备实时调节输出延迟的功能，能够非常快速地进行语音翻译。

Jun, 2023